DemoFusion DemoFusion是一个技术框架,旨在低成本生成高分辨率图像。该框架通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模型能够在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像转化为高清晰度图像。DemoFusion采用渐进式增强、跳跃残差和扩张采样机制,确保高分辨率图像生成的同时,保持图像的全局语义一致性和细节质量。适用于艺术创作、游戏开发、电影 AI项目与工具 2024年01月01日 29 点赞 0 评论 439 浏览
ResAdapter ResAdapter是一种专为扩散模型设计的分辨率适配器,允许图像生成模型生成任意分辨率和宽高比的图像,同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm,ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。 AI项目与工具 2024年01月01日 70 点赞 0 评论 201 浏览
AtomoVideo AtomoVideo是一款高保真图像到视频生成框架,能够从静态图像生成高质量视频内容。它通过多粒度图像注入和高质量数据集及训练策略,保证生成视频与原始图像的高度一致性和良好的时间连贯性。此外,AtomoVideo还支持长视频生成、文本到视频生成以及个性化和可控生成等功能。 AI项目与工具 2024年01月01日 32 点赞 0 评论 203 浏览
AniPortrait AniPortrait是一款由腾讯开源的AI视频生成框架,通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块:Audio2Lmk模块将音频转换为2D面部标记点,而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称,能够精确捕捉面部表情和嘴唇动作。 AI项目与工具 2025年06月12日 68 点赞 0 评论 452 浏览
Hyper Hyper-SD是由字节跳动研究人员开发的高效图像合成框架,通过轨迹分割一致性蒸馏(TSCD)、人类反馈学习(ReFL)和分数蒸馏等技术,显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时,大幅减少了推理步骤,实现了快速生成高分辨率图像,推动了生成式AI技术的发展。 AI项目与工具 2025年06月12日 73 点赞 0 评论 140 浏览
混元DiT 混元DiT(Hunyuan-DiT)是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型,具备细粒度的中英文理解能力,能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器,通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外,混元DiT在 AI项目与工具 2024年01月01日 64 点赞 0 评论 264 浏览
Diffutoon Diffutoon是一款基于扩散模型的AI框架,旨在将现实风格的视频转换为动漫风格。该框架支持高分辨率视频处理,能够实现风格化、一致性增强、结构引导和自动着色等功能。此外,Diffutoon具备内容编辑功能,用户可通过文本提示调整视频细节,确保视觉效果和内容的一致性。 AI项目与工具 2025年06月12日 45 点赞 0 评论 415 浏览
PixVerse V2 PixVerse V2是一款基于Diffusion+Transformer(DiT)架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频,单个片段最长可达8秒,且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频,适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。 AI项目与工具 2025年06月12日 47 点赞 0 评论 280 浏览
秒画趣拍 秒画趣拍是一款基于AI技术的创意写真小程序,由商汤科技开发。用户上传照片后,可以从多种模板中选择,生成具有不同风格和主题的高质量写真。其主要功能包括AI创意生成、丰富模板库、个性化定制及保持人物一致性。应用场景包括个人写真、节日庆祝、社交活动、校园生活记录及旅行记录等。 AI项目与工具 2025年06月12日 65 点赞 0 评论 254 浏览
FancyVideo FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。 AI项目与工具 2025年06月12日 28 点赞 0 评论 268 浏览