模型 - 智狐AI导航

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 746 浏览

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台，提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入，具备微信扩展、插件系统和支付接口，适用于企业及个人开发者构建智能应用。

AI项目与工具 2025年06月12日 42 点赞 0 评论 492 浏览

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 552 浏览

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术，基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示，适用于电商、设计、社交及品牌推广等场景，提升用户体验与决策效率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 848 浏览

Soundwave

Soundwave是由香港中文大学（深圳）开发的开源语音理解大模型，专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术，提升语音特征压缩效率，支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 684 浏览

食神

食神是老板电器研发的烹饪领域AI大模型，基于46年烹饪数据与DeepSeek技术，可精准理解用户需求。支持语音、文字交互，提供个性化菜谱推荐、健康膳食规划，并能与智能厨电联动，实现烹饪全流程自动化。同时具备文化讲解与情感陪伴功能，提升用户体验。适用于家庭烹饪、健康管理及文化体验等多个场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 636 浏览

龙猫LongCat

龙猫LongCat是美团自主研发的生成式AI大模型，具备多模态处理能力，可支持文本、图像等内容生成任务。其核心功能涵盖智能编程、会议记录、文档编辑、图形设计与视频脚本生成等，适用于多种办公场景。通过大规模预训练与混合训练策略，龙猫在实际应用中展现出高效、精准的特点，有效提升工作效率与创新能力。

AI项目与工具 2025年06月12日 70 点赞 0 评论 682 浏览

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 463 浏览

Agent TARS

Agent TARS 是字节跳动推出的开源多模态 AI 代理工具，支持浏览器、命令行和文件系统的集成，实现复杂任务的自动化执行。其核心功能包括代理工作流、数据处理、代码生成与解释等。基于事件流和模型上下文协议（MCP），Agent TARS 能高效分解任务并实时反馈结果，适用于网页自动化、任务管理、数据分析和代码辅助等多种场景。目前支持 macOS 平台，处于技术预览阶段。

AI项目与工具 2025年06月12日 29 点赞 0 评论 711 浏览

福棠·百川

福棠·百川是全球首个儿科大模型，由国家儿童医学中心等机构联合研发，具备强大的临床推理能力和循证医学模式，整合了海量医疗数据和专家经验，可提供个性化诊疗方案。该模型应用于基层和专家版，分别服务于日常诊疗和疑难病诊断，已在北京儿童医院投入使用，诊断准确率达95%。同时支持在线问诊、远程会诊、教育及科研等多场景应用。

AI项目与工具 2025年06月12日 12 点赞 0 评论 478 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期