视频 - 智狐AI导航

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具，基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型，支持实时交互与风格化控制，适用于虚拟主播、视频会议、内容创作等多种场景，具备高度可扩展性和实用性。

AI项目与工具 2025年06月12日 72 点赞 0 评论 612 浏览

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型，能够通过未标注视频数据学习复杂知识，包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型（LDM）和逆动态模型（IDM），支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异，且具备向自动驾驶、智能监控等场景扩展的潜力。

AI项目与工具 2025年06月12日 66 点赞 0 评论 612 浏览

FilmHERO

提供了超过 12,000 个 4K 或更高分辨率的“电影级”视频剪辑的精选目录。

影视资源 2025年06月05日 87 点赞 0 评论 612 浏览

OpusSearch

OpusSearch 是一款由 OpusClip 推出的 AI 视频搜索工具，支持用户按主题、演讲者或对象快速检索视频内容并实现再利用。该工具帮助创作者构建主题频道，响应热点趋势，并将旧视频转化为新内容。同时支持跨平台分发和自动化剪辑，提升内容运营效率，适用于内容创作、教学资源管理、品牌推广等多个场景。

AI项目与工具 2025年06月11日 73 点赞 0 评论 612 浏览

DisPose

DisPose是一项由多家顶尖高校联合研发的技术，专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式，结合混合ControlNet模块，实现了对骨骼姿态的有效控制，无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 611 浏览

LiveCC

LiveCC是一款由新加坡国立大学Show Lab与字节跳动联合开发的实时视频解说模型，基于自动语音识别字幕进行训练。它能够实时生成自然流畅的视频评论和回答相关问题，适用于体育、新闻、教育等多个场景。模型采用流式训练方法，结合大规模数据集和Qwen2-VL架构，具备低延迟和高质量的生成能力。LiveCC通过LiveSports-3K基准测试评估性能，广泛应用于视频内容分析与智能交互场景。

AI项目与工具 2025年06月11日 100 点赞 0 评论 611 浏览

牛片智能字幕

支持音视频内容提取，视频一键添加字幕，自媒体人必备。

字幕配音 2025年06月05日 85 点赞 0 评论 611 浏览

抖老板

短视频电商必备工具，实时更新订单

流量变现 2025年06月05日 68 点赞 0 评论 611 浏览

AIGCPanel

AIGCPanel是一款开源的AI数字人系统，支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法，实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能，可应用于影视制作、虚拟主播、教育培训等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 611 浏览

Roop

Roop是一款开源的AI视频换脸工具，支持用户通过一张图片替换视频中的面部，无需复杂的数据集或训练过程。它具有多种功能，包括一键换脸、多参数配置、面部对齐和性能加速。Roop利用生成对抗网络（GANs）生成逼真的面部图像，并能自动检测和对齐视频中的面部。其应用场景广泛，包括娱乐、社交媒体、电影制作、教育和艺术创作等领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 610 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期