视频

首页

视频

列表

默认

浏览次数

发布日期

Video

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 573 浏览

Animate

Animate

Animate-X 是一个基于 Latent Diffusion Model 的通用动画框架，可将静态图像转化为高质量的动态视频，特别适合拟人化角色动画的生成。它通过引入隐式和显式姿势指示器，增强了对运动模式的捕捉能力，并支持多种角色类型，无需严格对齐。该工具在游戏开发、影视制作、虚拟现实及社交媒体内容创作等方面具有广泛应用价值。 ---

AI项目与工具 2025年06月12日 27 点赞 0 评论 573 浏览

Ztalk.ai

Ztalk.ai

Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用，具备低延迟、高清晰度和强兼容性，可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能，确保沟通效率与质量。采用端到端加密，保障数据安全，适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。

AI项目与工具 2025年06月11日 75 点赞 0 评论 573 浏览

视界一粟YiSu

视界一粟YiSu

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

Ai视频生成 2025年06月05日 64 点赞 0 评论 572 浏览

Emu Video

Emu Video

Meta开发的文本到视频生成模型，Emu Video使用扩散模型根据文本提示创建视频，首先生成图像，然后根据文本和生成的图像创建视频。

Ai视频生成 2025年06月05日 40 点赞 0 评论 571 浏览

FantasyID

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架，基于扩散变换器和3D面部几何先验，实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术，提升面部动态表现，同时保持身份稳定性。支持多种应用场景，如虚拟形象、内容创作和数字人交互，具备无需微调的高效生成能力。

AI项目与工具 2025年06月12日 81 点赞 0 评论 571 浏览

Kaiber

Kaiber

Kaiber是一个视频生成引擎，用户可以根据自己的图片或文字描述创建视频。它为音乐家提供了Spotify Canvas等功能，为艺术家提供了灵感，为创作者提供了内容，为未来主义者提供了乐...

Ai视频生成 2026年06月22日 0 点赞 0 评论 571 浏览

Pinch

Pinch

Pinch 是一款基于 AI 的实时语音翻译视频会议平台，支持超过 30 种语言，提供口译和同声传译两种模式，满足多样化的沟通需求。其核心优势在于无需字幕即可实现自然流畅的语音翻译，具备低延迟和文化敏感性处理能力，适用于国际商务、教育、家庭沟通及客户服务等场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 570 浏览

V视频助手

V视频助手

视频下载助手帮助您一键下载各大网站视频

视频剪辑 2025年06月05日 93 点赞 0 评论 570 浏览

AutomateClips

AutomateClips

AutomateClips是一款人工智能视频生成器，专为社交媒体平台如TikTok、Instagram和YouTube设计，以自动化创建吸引人的视频内容。

Ai视频生成 2026年06月22日 0 点赞 0 评论 569 浏览

微信公众账号

微信扫一扫加关注