VideoGrain VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 336 浏览
SpeechGPT 2.0 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。 AI项目与工具 2025年06月12日 23 点赞 0 评论 337 浏览
Quick Prompt 一个专注于提示词(Prompt)的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库,并在任何网页输入框中快速插入预设的提示词内容。 Ai提示指令 2025年06月05日 67 点赞 0 评论 339 浏览
PicHound 一个专业图片全能助手,批量下载、同步、轻松收集管理的浏览器插件,PicHound支持批量下载、同步和轻松收集管理网站上的图片。 图片处理 2025年06月05日 50 点赞 0 评论 341 浏览
ConceptMaster ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架,可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型,有效解决身份解耦问题,尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试,适用于视频创作、动画制作、游戏开发及产品展示等领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 341 浏览
Live3D Live3D是一款面向虚拟主播(VTuber)的综合工具套件,提供面部追踪、3D形象定制、动画制作及直播互动等功能。其包含VTuber Maker、Editor、Gallery等组件,支持手部追踪、VRM模型编辑及AI动作捕捉,适用于虚拟直播、内容创作、在线教育等多种场景。该工具具备丰富的资源库和持续更新机制,适合个人与专业创作者使用。 AI项目与工具 2025年06月12日 13 点赞 0 评论 341 浏览
VideoToWords AI 一款免费在线将视频和音频转录为文本的工具,轻松在浏览器中将视频转换为文本,添加字幕等。还提供在线编辑、多种格式导出功能。 Ai语音工具 2025年06月05日 25 点赞 0 评论 341 浏览
X-Me X-Me是一个创新的AI Avatar视频生成平台,允许用户创建个性化的AI化身视频。用户可以上传自拍视频,输入文本,并生成支持147种语言的多语言视频内容。 Ai视频生成 1970年01月01日 0 点赞 0 评论 344 浏览
Verbalate Ai Verbalate是一款通用的视频翻译和唇语同步工具,能够轻松地将音频/视频内容转换为多种语言,并具备语音克隆和唇语同步功能。 Ai语音工具 2025年06月05日 19 点赞 0 评论 344 浏览