视频 - 智狐AI导航

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

Ai平台模型 2026年06月21日 0 点赞 0 评论 500 浏览

生成时代

AIGC 多模态 API 平台，提供 AIGC 图像生成、图像编辑、视频生成、视频编辑、音频生成、训推一体等 API，免去 GPU 和模型维护成本，帮助开发者快速搭建 AIGC 应用。

Ai平台模型 2025年06月05日 88 点赞 0 评论 500 浏览

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集，包含18,000个视频片段，涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随（AIF）基准，用于评估世界模型的预测能力，并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 500 浏览

Cleanvoice

Cleanvoice是一款利用AI技术优化音频和视频编辑的工具，适用于播客制作、视频内容编辑、企业培训、教育讲座及采访等多种场景。其核心功能包括填充词移除、背景噪音过滤、播客摘要生成、语音转录、多轨混音等，旨在提升音频质量并节省编辑时间。无论是个人创作者还是团队用户，均可通过Cleanvoice轻松实现高效的内容整理与发布。

AI项目与工具 2025年06月12日 100 点赞 0 评论 499 浏览

ViewCrafter

ViewCrafter是一种由北京大学、香港中文大学和腾讯合作开发的先进视频扩散模型。它能够从单一或少量图像中合成高质量的新视图，结合视频扩散模型和基于点的3D表示，通过迭代视图合成策略和相机轨迹规划生成多样化的视图。该模型在多个数据集上展示了强大的泛化能力和性能，适用于实时渲染、沉浸式体验及场景级文本到3D生成等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 499 浏览