Vision Search Assistant Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架,旨在提升模型对未知视觉内容的理解能力。它通过网络检索,使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色,支持图像描述生成、网络知识搜索、协作生成等功能,可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。 AI项目与工具 2025年06月12日 100 点赞 0 评论 774 浏览
Dubbing AI DubbingAI 语音生成器作为实时变声器,可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。 Ai语音工具 2025年06月05日 19 点赞 0 评论 775 浏览
Hatch Hatch是一款AI数字创意画布工具,提供无限的创作空间,能够根据用户的思考过程进行适应和调整。用户可以从一个提示、图像或问题开始,将想法以视觉化的方式进行组织和连接。它支持自由布局、无限扩展、智能生成、图像编辑、AI助手和实时协作等功能,帮助用户将创意转化为现实。适用于创意构思、项目规划和内容创作等场景。 AI项目与工具 2025年06月11日 83 点赞 0 评论 776 浏览
Company Research Agent Company Research Agent是一款基于多智能体框架的公司研究工具,支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能,确保信息的相关性和准确性,并通过WebSocket实现实时进度更新,提升研究效率和用户体验 AI项目与工具 2025年06月11日 78 点赞 0 评论 777 浏览
GPT-SoVITS 一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。 Ai平台模型 1970年01月01日 0 点赞 0 评论 778 浏览
HRAvatar HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。 AI项目与工具 2025年06月11日 43 点赞 0 评论 782 浏览
妙问 妙问是腾讯广告推出的AI营销辅助工具,支持7×24小时在线服务,覆盖广告主从筹备到复盘的全流程需求。其核心功能包括快问快答、深度分析、移动办公等,能提供实时数据支持、爆款素材建议、广告审核答疑及多账户管理。适用于广告咨询、投放优化、效果分析及移动管理等场景,提升营销效率与决策质量。</p> AI项目与工具 2025年06月11日 22 点赞 0 评论 782 浏览
RealtimeSTT RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。 AI项目与工具 2025年06月12日 97 点赞 0 评论 783 浏览
MusicFX DJ MusicFX DJ是一款由Google DeepMind开发的人工智能音乐生成工具,利用实时文本提示生成多样化音乐作品。它支持多提示词混合、风格精细调控、乐器编排以及高质量音频输出等功能,适用于个人创作、现场表演、音乐教育及社交媒体内容制作等多个场景,为音乐爱好者和专业人士提供便捷高效的创意工具。 AI项目与工具 2025年06月12日 30 点赞 0 评论 784 浏览
creatify Creatify是一款由人工智能驱动的视频广告制作平台,支持根据产品信息自动生成高质量营销视频。其主要功能包括自动视频生成、AI脚本创作、多样化模板选择、动态特效设计及多语言支持。Creatify适用于电商、品牌推广、教育培训等多种场景,帮助用户高效制作专业视频广告,降低时间和成本投入。 AI项目与工具 2025年06月12日 64 点赞 0 评论 784 浏览