模型

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型,具备听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语,主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

LightLab

LightLab是一款基于扩散模型的图像光源控制工具,支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练,该工具能生成逼真的光照效果,如阴影和反射。其交互式界面使用户能够直观地进行光照编辑,适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

Kaedim

无论您是构建VR游戏还是3D艺术,Kaedim都可以为您生成高清3D模型。不需要建模经验

光语大模型

无限光年公司发布的一款结合大语言模型与符号推理的AI大模型,光语大模型目的是解决大模型在行业应用中的幻觉问题,提高了模型的可信度和专业性。

AgiBot Digital World

AgiBot Digital World 是一款基于 NVIDIA Isaac-Sim 的高保真机器人仿真框架,支持多模态大模型驱动的任务与场景自动生成,具备真实感强的视觉与物理模拟能力。其提供多样化专家轨迹生成、域随机化与数据增强功能,助力机器人技能训练与算法优化,并开源了包含多种场景和技能的数据集,适用于工业自动化、服务机器人开发及人工智能研究等领域。

TestSprite

TestSprite 是一款基于 AI 的自动化测试平台,支持后端 API、前端 UI、数据及 AI 模型的测试,能够自动生成测试计划、执行测试并输出详细报告。其核心优势在于提升测试效率、减少人工干预,并适用于多种测试场景,如软件发布前验证、CI/CD 集成、生产环境监控等,帮助企业提升软件质量与交付速度。

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术,通过提取响度、亮度和音高概率等控制信号,结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架,同时赋予声音设计师更强的表达力与可控性,广泛适用于电影、游戏、音乐制作及教育等多个领域。

文修大模型

文修是蜜度提供的一项基于人工智能的校对和润色服务,旨在提高中文文档的质量和表达的流畅性。

西湖大模型

西湖大模型西湖心辰开发的多模态大模型,既具备通过跨领域的知识解决问题的超高智商,也具备通过情感感知、长期记忆形成的超高情商。

MCPHub

MCPHub 是一个集成了多种 MCP 服务器的聚合平台,支持将多个服务器整合至流式 HTTP(SSE)端点,提供集中式管理界面和协议兼容性。具备热插拔配置、访问控制、安全认证等功能,支持 Docker 部署,适用于 AI 工具集成、多模型协同及私有化部署等场景,提升 AI 开发与管理效率。