cobalt Cobalt是一款开源流媒体下载工具,支持从各大视频网站、社交媒体和音乐平台下载视频、音频和图片。其主要功能包括高分辨率视频下载(最高8K)、多种音频格式支持、字幕自动提取及个性化主题切换。用户可通过网页版或自托管Docker方式使用,无需注册即可操作,适合在线学习、视频编辑、音乐收藏等多种应用场景。 AI项目与工具 2025年06月12日 99 点赞 0 评论 491 浏览
Video Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 492 浏览
Ztalk.ai Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用,具备低延迟、高清晰度和强兼容性,可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能,确保沟通效率与质量。采用端到端加密,保障数据安全,适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。 AI项目与工具 2025年06月11日 75 点赞 0 评论 494 浏览
VideoSrt VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。 Ai开源项目 2025年06月05日 31 点赞 0 评论 501 浏览
字幕说 字幕说是一款为自媒体创作者设计的在线工具,提供文字转语音、音文对齐、视频合成等功能。支持多语言发音、字幕翻译与优化,帮助用户高效生成高质量视频内容,无需出镜即可完成制作,提升创作效率。 AI项目与工具 2025年06月12日 42 点赞 0 评论 502 浏览
AIVLOG AIVLOG是一款基于AI技术的视频编辑工具,专为视频创作者设计,具备自动剪辑、智能字幕生成、特效与音乐一键添加等功能。支持多平台使用,提供丰富的模板和素材,便于快速制作高质量Vlog,并可一键分享至社交平台,提升内容传播效率。 AI项目与工具 2025年06月12日 22 点赞 0 评论 505 浏览
VDSpeak 一个专注于为YouTube视频提供多语言翻译和配音服务的在线工具,只需输入视频链接,就能快速生成翻译字幕或配音音频。 Ai办公效率 2025年06月05日 32 点赞 0 评论 508 浏览
Whispo Whispo是一款AI驱动的语音转录工具,支持用户通过快捷键快速录制语音并将其转写为文本,同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景,旨在提升工作效率和用户体验。 AI项目与工具 2025年06月12日 47 点赞 0 评论 508 浏览