多模态 - 智狐AI导航

Sa2VA

Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型，结合SAM2与LLaVA技术，实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务，具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 678 浏览

Soundwave

Soundwave是由香港中文大学（深圳）开发的开源语音理解大模型，专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术，提升语音特征压缩效率，支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 679 浏览

ExperAI

ExperAI是一款基于AI聊天机器人的创新型平台，支持文本和语音交互，可上传文档和自定义知识库以提升对话个性化水平。其功能包括创建数字个性、知识分享、客户服务、个性化推荐及社交媒体集成等，广泛应用于客户服务、教育、健康咨询、个人助理和市场调研等领域，旨在通过自然语言处理技术，为用户提供深入且高效的对话体验。

AI项目与工具 2025年06月12日 82 点赞 0 评论 679 浏览

阶跃星辰

一家专注于人工智能领域的创新公司，阶跃星辰以“智能阶跃，十倍每一个人的可能”为使命，旨在实现通用人工智能（AGI）。

Ai平台模型 2025年06月05日 34 点赞 0 评论 680 浏览

星河易创AI

全功能一站式AI创作平台，集成了行业领先的ChatGPT4.0和ChatGPT3.5对话系统，Midjourney的绘画能力，DALL-E的文本到图像创造力，以及GPT4-ALL的多模态能力。

AI写作对话 2025年06月05日 83 点赞 0 评论 682 浏览

BEHAVIOR Robot Suite

BEHAVIOR Robot Suite（BRS）是斯坦福大学李飞飞团队研发的机器人操作框架，专注于实现全身协调与复杂家务任务。它结合了低成本遥操作接口JoyLo和多模态学习算法WB-VIMA，提升机器人在真实环境中的适应性和操作精度。适用于家务自动化、垃圾处理、衣物整理等多个场景，具备高度灵活性和故障恢复能力。

AI项目与工具 2025年06月12日 93 点赞 0 评论 683 浏览

MyShell

MyShell是一个全面的AI应用开发平台，提供了经典、开发和无代码三种模式，适合各种技能水平的用户。该平台支持创建AI原生应用，并通过AI代理商店提供多模态应用，涵盖效率工具、教育应用、游戏和客户服务等多个领域。平台还设有激励机制，鼓励创作者和用户参与，同时倡导使用开源模型，确保创作者和用户能够公平地分享收益。

AI项目与工具 2025年06月12日 97 点赞 0 评论 683 浏览

文心智能体平台

百度推出的一个基于文心大模型的AI智能体（Agent）平台，文心智能体平台旨在支持广大开发者根据自身行业领域、应用场景，选取不同类型的开发方式，打造大模型时代的产品能力。

AI写作对话 2025年06月05日 54 点赞 0 评论 684 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 686 浏览

异世界回响

异世界回响是一款基于人工智能的社交平台，用户可与虚拟角色进行沉浸式交流。平台支持自定义角色形象与声音，提供AIGC工具创建独一无二的角色，并具备数字分身功能。主要面向寻求创新社交体验、情感陪伴以及对AI技术感兴趣的人群。

AI项目与工具 2025年06月12日 28 点赞 0 评论 686 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期