多模态 - 智狐AI导航

Second Me

Second Me 是由心识宇宙开发的开源 AI 身份模型，支持创建个性化且私有的 AI 代理，代表用户的真实自我。它提供 Chat Mode 和 Bridge Mode 两种交互模式，适用于不同场景下的沟通与信息反馈。支持本地运行，保障数据隐私。Second Me 采用分层记忆模型、个性化对齐架构等技术，具备多角色适应、智能记忆管理和链式推理能力，广泛应用于个人助理、职业发展、社交互动、学习辅导

AI项目与工具 2025年06月12日 67 点赞 0 评论 614 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 614 浏览

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型，支持1080p高清视频生成，具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异，包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构，融合文本、图像和视频信息，适用于影视制作、广告宣传及动画创作等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 635 浏览

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链，涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理，提供低代码编排和 RAG 框架，适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

AI项目与工具 2025年06月12日 75 点赞 0 评论 517 浏览

TaoAvatar

TaoAvatar是阿里巴巴推出的高保真、轻量级3D全身虚拟人技术，基于3D高斯溅射（3DGS）实现照片级真实感的虚拟形象生成。支持多模态驱动，具备高帧率实时渲染能力，适用于AR、移动设备及高清显示平台。其轻量级架构结合深度学习优化，提升了运行效率与交互自然度，广泛应用于电商直播、全息通信、虚拟会议、在线教育及娱乐等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 727 浏览

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型，具备深度推理能力，可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式，拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异，适用于学术研究、软件开发、创意工作和企业应用等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 770 浏览

LHM

LHM是由阿里巴巴通义实验室推出的3D人体模型重建系统，能从单张图像快速生成高质量、可动画化的3D人体模型。基于多模态Transformer架构，融合3D几何与2D图像信息，保留服装与面部细节，并采用3D高斯点云表示方式，支持实时渲染和姿态控制。适用于AR/VR、游戏开发、影视制作及教育等多个领域，具备高保真、强泛化和低延迟等优势。

AI项目与工具 2025年06月12日 93 点赞 0 评论 765 浏览

StarVector

StarVector 是一个开源多模态视觉语言模型，支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构，结合图像编码与语言模型，生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练，适用于图标设计、艺术创作、数据可视化等多种场景，具备良好的性能和扩展性。

AI项目与工具 2025年06月12日 68 点赞 0 评论 627 浏览

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 741 浏览

Soundwave

Soundwave是由香港中文大学（深圳）开发的开源语音理解大模型，专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术，提升语音特征压缩效率，支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 677 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期