Phantom Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。 AI项目与工具 2025年06月12日 72 点赞 0 评论 522 浏览
智谱清影 智谱清影是一款基于AI的视频生成工具,用户可以通过输入文本或上传图片,生成10秒、4K、60帧的高质量视频。支持多种风格和背景音乐,适用于个人创作者和专业制作团队。该工具基于CogVideoX模型,提升了视频的连贯性和逻辑一致性,并支持API调用。 AI项目与工具 2025年06月12日 29 点赞 0 评论 538 浏览
Vace AI Vace AI 是一款集成视频生成与编辑功能的 AI 工具,支持文本到视频、参考图像生成视频等功能,并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术,可精准保留关键视觉元素,生成高质量视频,适用于短视频制作、创意内容生成及广告设计等多种场景。 AI项目与工具 2025年06月12日 92 点赞 0 评论 541 浏览
腾讯混元文生视频 腾讯混元文生视频是一款利用AI技术生成高质量视频内容的工具,可根据文本提示生成具有大片质感的视频。它支持多语言输入,涵盖高清画质、流畅镜头切换及自然场景模拟等功能,适用于电影制作、广告设计、教育培训等多种应用场景。 AI项目与工具 2025年06月12日 22 点赞 0 评论 562 浏览
ConsisID ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具,其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性,同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理,广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。 AI项目与工具 2025年06月12日 18 点赞 0 评论 571 浏览
CogVideo 目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。 Ai平台模型 2025年06月05日 16 点赞 0 评论 571 浏览
Lumiere 谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。 Ai开源项目 2025年06月05日 74 点赞 0 评论 579 浏览
Mora Mora是一个多智能体框架,专为视频生成任务设计,通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora,Mora仍能在生成高分辨率视频方面表现出色。 AI项目与工具 2024年01月01日 75 点赞 0 评论 583 浏览
VideoDrafter 一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。 Ai开源项目 2025年06月05日 89 点赞 0 评论 586 浏览