AI视频
Generative Omnimatte
Generative Omnimatte 是一种基于 AI 的视频编辑技术,通过其核心模型 Casper 实现视频的多层次分解与编辑。它能够自动分离物体与背景,并支持动态背景处理及多对象场景的精细编辑。主要功能包括视频分层、对象移除、背景替换、Trimask 控制等,广泛应用于电影制作、广告设计、游戏开发及虚拟现实领域。
Giga视频超级工厂
Giga视频超级工厂是一款利用AI技术进行短视频批量制作的平台,主要功能包括多元短视频生成、多语言视频翻译、多语言字幕翻译、图文转视频及报纸生成视频等。平台能够自动分析原始视频内容,批量生成适合不同平台、风格和时长的短视频,并支持配音播报、原声播报和数字人播报。平台还能够自动生成标题、口播内容、分享文案和标签,简化短视频的制作流程,帮助媒体机构在社交平台上实现短视频的高效生产和国际化传播。
豆包PixelDance
豆包PixelDance是一款由字节跳动开发的AI视频生成工具,基于DiT架构,支持文生视频和图生视频功能。它具备强大的语义理解能力,可生成长达10秒的连贯视频片段,并拥有丰富的运镜效果。该工具支持多种艺术风格和视频比例,适用于影视、广告、短视频等多种场景,极大简化了视频创作流程。
StreamBridge
StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。