视频

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Animode

Animode是一款利用3D技术和人工智能实现视频动漫化的创作工具,支持从图片或视频素材生成高质量的二次元风格内容。其核心功能包括动作捕捉、场景多样化选择、实时渲染优化及后期编辑支持,广泛应用于专业视频制作、自媒体创作、教育培训等领域,特别适合需要高效且高质量视觉呈现的场景。

抖商眼

【视频带货】领先的视频数据开放平台,为内容创作者在创作运营方面提供数据支持。

TemPolor

一款人工智能音乐生成器,TemPolor可以将您的文本转化为个性化音乐,创造属于您自己的音乐交响曲。用户使用文字、敲击或哼唱来提供旋律灵感,然后帮助将其生成一首歌。

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型,具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务,适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具,基于扩散变换器(DiT)架构,支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化,实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域,为视觉内容创作提供高效解决方案。

万兴录演

一款集录制、编辑于一体,支持PPT、屏幕、音频、人景融合、虚拟人等录制,极大的便捷了广大的知识内容创作者,是一款好用、靠谱的录课工具!

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型,通过帧上下文打包和抗漂移采样技术,实现高效、稳定的视频生成。其仅需 6GB 显存即可运行,支持实时高清视频生成,具备灵活的调度策略,适用于多种应用场景,如短视频制作、游戏开发、教育与广告等,显著降低了视频生成的硬件门槛。

VideoChat

VideoChat是一款开源的实时数字人对话系统,支持语音输入与实时对话功能。用户可自定义数字人形象与音色,实现音色克隆。系统集成多种技术,包括语音识别、大语言模型生成及文本转语音,支持流式视频输出,适用于客户服务、在线教育、新闻播报、直播互动及娱乐等多个领域。