视频生成 - 智狐AI导航

AtomoVideo

AtomoVideo是一款高保真图像到视频生成框架，能够从静态图像生成高质量视频内容。它通过多粒度图像注入和高质量数据集及训练策略，保证生成视频与原始图像的高度一致性和良好的时间连贯性。此外，AtomoVideo还支持长视频生成、文本到视频生成以及个性化和可控生成等功能。

AI项目与工具 2024年01月01日 32 点赞 0 评论 544 浏览

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力，通过创新的梯度条件方法和自回归扩展技术，生成了具有高度时间连贯性和质量的视频样本。

Ai绘画生成 2026年06月21日 0 点赞 0 评论 545 浏览

ContentV

ContentV是字节跳动开源的80亿参数文生视频模型框架，通过替换Stable Diffusion 3.5 Large的2D-VAE为3D-VAE并引入3D位置编码，提升视频生成能力。采用多阶段训练策略和流匹配算法，实现高效训练。支持文本到视频生成、自定义视频参数、风格迁移与融合、视频续写与修改等功能，适用于视频内容创作、游戏开发、VR/AR和特效制作等场景。

AI项目与工具 2025年06月11日 45 点赞 0 评论 545 浏览

灰色AI | GreyAi

一键实现无缝AI换脸等操作，使用数字人虚拟人解放生产力。灰色AI基于多年人工智能经验，大幅简化ai换脸操作方式。

AI服务商 2025年06月05日 24 点赞 0 评论 546 浏览

Digen AI

一种利用AI技术创建的克隆数字人，Digen AI人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术，使得Digen AI可以随时随地与真人进行准确交互性对话。

Ai视频生成 2025年06月05日 59 点赞 0 评论 546 浏览

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示，生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题，并采用部分参数训练和多任务训练策略，保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

AI项目与工具 2025年06月11日 11 点赞 0 评论 548 浏览

书生·筑梦2.0

它不仅提供了更大的创作灵活性，还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架，为视频内容创作者提供了强大的工具，以创造更加生...

Ai平台模型 2026年06月21日 0 点赞 0 评论 550 浏览

DreamVideo

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架，能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块，这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

AI项目与工具 2025年06月12日 65 点赞 0 评论 551 浏览

DreaMoving

DreaMoving是一个基于扩散模型的人类视频生成框架，由阿里巴巴集团研究团队开发。该框架通过视频控制网络（Video ControlNet）和内容引导器（Content Guider）实现对人物动作和外观的精确控制，允许用户通过文本或图像提示生成个性化视频内容。其主要功能包括定制化视频生成、高度可控性、身份保持、多样化的输入方式以及易于使用的架构设计。DreaMoving广泛应用于影视制作、游

AI项目与工具 2024年01月01日 93 点赞 0 评论 551 浏览

Vozo AI

一款AI视频生成器，Vozo AI通过重新编写、重新配音、编辑声音，然后通过提示将现有视频配音成新的视频故事。用户可以轻松将视频转换为宣传片、喜剧或多语言版本。

Ai语音工具 2025年06月05日 78 点赞 0 评论 551 浏览

视频生成

首页

视频生成

列表

默认

浏览次数

发布日期