视频生成

Open

Open-Sora是一个开源视频生成模型,基于DiT架构,通过三个阶段的训练(大规模图像预训练、大规模视频预训练和高质量视频数据微调),生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT(Spatial-Temporal Diffusion Transformer)核心组件,利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程,供

ToonCrafter

ToonCrafter是一个展示平台,它利用先进的生成对抗网络(GAN)技术,将用户的原始动漫帧转化为一系列风格一致、过渡自然的画面。

Wan

Wan是阿里推出的AI创意平台,支持AI绘画与视频生成,能根据文字或图片生成高质量艺术图像和动态视频。提供多种风格选择与创意探索功能,用户可保存作品并分享。适用于艺术设计、内容创作、教育学习及商业营销等多个领域,助力提升创作效率与创意表达。

书生·筑梦2.0(Vchitect 2.0)

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型,支持文本到视频和图像到视频的转换,生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架,适用于广告、教育、影视等多个领域。

Loopy AI

字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型,能够将静态图像转化为动态视频,实现音频与面部表情、头部动作的完美同步。

灰色AI | GreyAi

一键实现无缝AI换脸等操作,使用数字人虚拟人解放生产力。灰色AI基于多年人工智能经验,大幅简化ai换脸操作方式。

ContentV

ContentV是字节跳动开源的80亿参数文生视频模型框架,通过替换Stable Diffusion 3.5 Large的2D-VAE为3D-VAE并引入3D位置编码,提升视频生成能力。采用多阶段训练策略和流匹配算法,实现高效训练。支持文本到视频生成、自定义视频参数、风格迁移与融合、视频续写与修改等功能,适用于视频内容创作、游戏开发、VR/AR和特效制作等场景。

potion

Potion是一款专注于AI视频生成的专业平台,通过深度学习技术实现用户面部表情、声音的精准模拟,支持文本到视频的自动化转换。其主要功能涵盖个性化视频创作、唇形同步、动态视频生成及多场景应用(如销售、营销、教育和客户服务)。产品设计注重效率与灵活性,适合各类企业提升品牌影响力与客户互动效果。

Auto Think

Auto Think是快手Kwaipilot团队开源的KwaiCoder-AutoThink-preview自动思考大模型,针对深度思考大模型的“过度思考”问题,提出了一种全新的训练范式。模型融合“思考”和“非思考”能力,能根据问题难度自动切换模式,提升复杂任务表现。在代码和数学类任务中,性能提升可达20分。其技术原理包括最小提示干预和多阶段强化学习,适用于视频生成、文案创作、智能客服等多个场景。

ShortMake AI

一款能够将想法转化为爆款视频的AI视频生成工具。不需要视频编辑技术,通过ShortMake AI可快速生成视频脚本、配音、图像和字幕,并将这些元素组合成视频。