视频
DrivingDojo
DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。
Cleanvoice
Cleanvoice是一款利用AI技术优化音频和视频编辑的工具,适用于播客制作、视频内容编辑、企业培训、教育讲座及采访等多种场景。其核心功能包括填充词移除、背景噪音过滤、播客摘要生成、语音转录、多轨混音等,旨在提升音频质量并节省编辑时间。无论是个人创作者还是团队用户,均可通过Cleanvoice轻松实现高效的内容整理与发布。
ViewCrafter
ViewCrafter是一种由北京大学、香港中文大学和腾讯合作开发的先进视频扩散模型。它能够从单一或少量图像中合成高质量的新视图,结合视频扩散模型和基于点的3D表示,通过迭代视图合成策略和相机轨迹规划生成多样化的视图。该模型在多个数据集上展示了强大的泛化能力和性能,适用于实时渲染、沉浸式体验及场景级文本到3D生成等多种应用场景。
Eightify AI
Eightify AI ChatGPT是一个强大的工具,允许用户快速轻松地生成YouTube视频的摘要。借助人工智能技术,用户可以方便快捷地获取YouTube视频的要点和关键内容。
TeleAI 视频生成大模型
TeleAI视频生成大模型是一款基于两阶段生成框架的AI工具,能够根据文本描述生成高质量视频,具备主体外观一致性、动作控制精准性以及场景过渡流畅性等特点。它广泛应用于影视制作、广告行业、教育培训、游戏开发及新闻报道等领域,助力提升创作效率并降低成本。
