AI项目与工具

Deep Research Web UI

Deep Research Web UI 是一款开源 AI 研究助手,支持多轮次搜索、树状可视化研究路径、多语言处理及数据导出功能。具备智能搜索、数据分析、报告生成能力,适用于文献综述、市场调研等场景。工具可在浏览器端运行,保障隐私安全,并兼容多种 AI 模型,支持本地部署与自定义配置。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

iAgents

iAgents是一款由清华大学研发的多AI智能体协作框架,专注于通过个性化AI智能体协助用户完成复杂任务。它利用infoNav推理机制优化信息交换,支持多轮对话与任务解决,同时具备混合记忆机制(清晰记忆与模糊记忆)用于高效信息检索。iAgents广泛应用于会议协调、项目管理、客户服务等领域,显著提升了团队协作效率。

易我人声分离

易我人声分离是一款基于AI技术的音频编辑工具,可智能分离音频或视频中的人声与背景音乐,支持多种格式,并具备一键操作的便捷性。它不仅适用于音乐创作和视频剪辑,还支持精确分离乐器声音,广泛应用于语言学习、影视后期制作等多个领域。

CoA

CoA是由谷歌开发的多智能体协作框架,用于解决大语言模型在处理长文本任务时的上下文限制问题。它将长文本分割成多个片段,由多个智能体依次处理并通过链式通信传递关键信息,最终由管理智能体整合生成结果。该框架无需额外训练,支持多种任务类型,如问答、摘要和代码补全,且具有高效性和可扩展性。其时间复杂度优化显著提升了处理长文本的效率。

Evolving Agents

Evolving Agents 是一个用于构建、管理及优化 AI 代理的生产级框架,支持代理间通信与协作,并能根据语义理解和历史经验动态进化。具备智能代理进化、标准化通信协议、语义搜索、YAML 工作流定义等功能,适用于文档处理、医疗、金融、客服等场景,提升任务处理效率与效果。

Slide Dish

Slide Dish是一款旨在提升家庭烹饪与摆盘技能的移动应用,其核心功能包括AI驱动的食谱生成、详细的烹饪指导、摆盘创意以及购物清单管理。用户可依据现有食材或个人偏好获取定制化食谱,并通过社交平台与其他烹饪爱好者交流心得。此应用适用于家庭厨师、食材管理者、特殊饮食需求者以及烹饪初学者,帮助他们在日常烹饪、节庆宴请及技能提升中实现更佳表现。

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型,能通过分析普通手机拍摄的视频生成详细的 3D 场景布局,涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术,实现空间认知与语义标注,并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域,具备物理规则嵌入和结构化场景生成能力。

Lyria 2

Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,支持高保真音频输出与多种音乐风格生成,具备实时创作、文本驱动创作及音频编辑功能。结合扩散模型与 GAN 技术,实现风格解耦与动态调整,适用于音乐制作、影视配乐、广告音乐等场景。集成于 Music AI Sandbox,提供模块化工具链,降低创作门槛,并嵌入数字水印技术以确保内容可识别性。

ConverzAI

ConverzAI是一款基于AI技术优化招聘流程的平台,通过虚拟招聘人员实现候选人筛选、多渠道互动和实时评估。该工具适用于商业、医疗保健及专业服务等多个领域,能提升招聘效率与质量,支持数据驱动的决策,广泛应用于校园招聘、临时用工等场景。