视频生成

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具,具备文本到视频生成、图像到视频转换等功能,支持高清视频输出及音效匹配。它通过三维变分自编码器(3D VAE)、Transformer架构等技术手段,提升了视频生成的质量与效率,适用于内容创作、广告营销、教育培训等多个领域。

Vid2World

Vid2World是由清华大学和重庆大学联合开发的创新框架,能够将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术,解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理,适用于机器人操作、游戏模拟等复杂环境,具有广泛的应用前景。

跃问视频

由阶跃星辰开发的AI视频生成工具,只需通过简单的文本输入跃问视频就可以生成最长10秒的视频。

海螺AI

海螺AI是一款由MiniMax打造的AI视频生成工具,凭借其强大的文本转视频能力和图像扩展功能,可快速生成高质量、情感丰富的视频内容。支持多种语言、风格和场景定制,具备高清画质输出、智能审核及模板选择等功能,广泛应用于社交媒体、营销、影视制作、教育等领域。

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Q.AI

Q.AI是一款基于AI技术的视频创作平台,涵盖AI写真、视频生成、文生图及帧库管理等功能。它能够将文字描述转化为高质量的视频或图像,并提供智能配音、自动字幕匹配等辅助工具,助力个人与企业快速完成视频创作。主要应用场景包括视频制作、内容创作、社交媒体运营、广告营销以及教育培训等领域。

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。

Heygem

Heygem是一款由硅基智能推出的开源数字人模型,支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音,30秒内完成克隆,60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势,适用于内容创作、教育、直播、影视及客服等多个领域,提供高效、低成本的数字人解决方案。

Creatus.AI

Creatus.ai 是一个允许您使用人工智能从文本输入生成引人入胜的视频内容的平台。无论您是想为社交媒体渠道、网站、博客还是在线课程制作视频,Creatus.ai 都可以帮助您轻松高效地完成。

AvatarFX

AvatarFX是由Character.AI开发的AI视频生成工具,通过上传图片和选择语音,可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成,具备高时间一致性。采用扩散模型与音频条件化技术,确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作,提供高效、高质量的视频生成体验。