Video Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 492 浏览
cobalt Cobalt是一款开源流媒体下载工具,支持从各大视频网站、社交媒体和音乐平台下载视频、音频和图片。其主要功能包括高分辨率视频下载(最高8K)、多种音频格式支持、字幕自动提取及个性化主题切换。用户可通过网页版或自托管Docker方式使用,无需注册即可操作,适合在线学习、视频编辑、音乐收藏等多种应用场景。 AI项目与工具 2025年06月12日 99 点赞 0 评论 491 浏览
Addsubtitle AI 一款在线视频编辑工具,具备视频翻译(涵盖100多种语言)、添加多语言字幕(可自定义样式)、视频重写与配音等功能。 Ai视频生成 2025年06月05日 88 点赞 0 评论 490 浏览
AiNiee AiNiee是一款基于AI技术的多功能翻译工具,支持多种文件格式和语言的自动翻译,包括游戏文件、小说、字幕等。它通过接入主流AI平台,提供高效的多语言翻译服务,支持自定义参数设置和批量翻译功能,确保翻译结果的准确性和流畅性,广泛应用于游戏本地化、字幕制作、电子书阅读等多个领域。 AI项目与工具 2025年06月12日 60 点赞 0 评论 490 浏览
WUI.Ai 一款将可以将长视频转成适合社交媒体平台的短视频片段的视频编辑工具。WUI.ai提供自动识别视频中的亮点、添加字幕、优化内容格式等功能 Ai视频生成 2025年06月05日 96 点赞 0 评论 487 浏览
Memo Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。 Ai语音工具 1970年01月01日 0 点赞 0 评论 485 浏览
AI Comic Factory AI Comic Factory是一款基于人工智能技术的在线漫画生成平台,用户无需绘画技能即可创作漫画。它提供多样化的风格选择、布局调整、字幕添加等功能,并支持角色一致性维护和图像重绘,适合个人创作、教育、广告及IP开发等多种应用场景。 AI项目与工具 2025年06月12日 78 点赞 0 评论 480 浏览