模型 - 智狐AI导航

RoboBrain

RoboBrain是由智源研究院开发的开源具身大脑模型，支持任务规划、可操作区域感知和轨迹预测等功能。其基于LLaVA框架，采用多阶段训练策略，具备高分辨率图像处理和长历史帧记忆能力。适用于多机器人协作、复杂任务执行及实时优化场景，依托ShareRobot数据集提升模型性能，广泛应用于机器人操作领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 669 浏览

零一万物

零一万物是李开复带队孵化的AI2.0公司，总部注册于北京，集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。

AI服务商 2025年06月05日 56 点赞 0 评论 669 浏览

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统，能高效识别和过滤有害及低质量视频。它结合视觉语言模型（VLM）和链式推理（CoT）技术，支持动态策略更新和强化学习，提升审核准确性。系统在离线测试中准确率达92.4%，有效降低用户举报率，优化推荐体验，助力平台内容生态健康发展。

AI项目与工具 2025年06月11日 91 点赞 0 评论 669 浏览

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型，专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐，支持Token级图文交互，提升了多模态任务性能。其基于自研的TokenIT数据集进行训练，涵盖2000万张图像和18亿高质量Token-Mask对，覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域，具有广泛的适用性和

AI项目与工具 2025年06月12日 90 点赞 0 评论 669 浏览

HiveChat

HiveChat 是一款面向中小团队的 AI 聊天工具，支持多款主流 AI 模型，具备文本交互、图像理解、LaTeX/Markdown 渲染等功能。系统基于 React 构建，支持多种部署方式，适用于企业沟通、学术研究、内容创作等场景，提供高效、便捷的智能协作体验。

AI项目与工具 2025年06月12日 28 点赞 0 评论 668 浏览

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型，支持 119 种语言，参数规模从 0.6B 到 8B。它能够精准捕捉文本语义，支持多语言处理、高效检索和语义相关性排序，并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异，适用于智能搜索、推荐系统、问答系统和教育领域等场景。

AI项目与工具 2025年06月11日 37 点赞 0 评论 668 浏览

豆包1.5·UI

豆包1.5·UI-TARS是字节跳动推出的一款面向图形用户界面（GUI）的智能代理模型，具备视觉理解、逻辑推理和操作执行能力。它无需预定义规则，即可实现端到端的GUI任务自动化，适用于办公、测试、客服及机器人交互等多个场景。模型基于多模态融合与端到端学习技术，支持高效的界面交互与精准的视觉定位。

AI项目与工具 2025年06月11日 31 点赞 0 评论 668 浏览

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架，支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit（VCU），可整合多模态输入，实现任务灵活组合。支持480P和720P分辨率，适用于创意视频制作、视频修复、风格转换及互动创作等场景，具备高灵活性和广泛的应用潜力。

AI项目与工具 2025年06月12日 33 点赞 0 评论 667 浏览

Granite 3.0

Granite 3.0是IBM推出的一套先进的AI模型，适用于多种应用场景，包括客户服务自动化、内容创作与审核、数据分析以及编程辅助。它通过检索增强生成技术和多语言支持提升任务效率，并具备出色的安全防护能力。该模型采用深度学习和混合专家架构，经过大规模数据训练，为企业提供高效、灵活且可靠的AI解决方案。

AI项目与工具 2025年06月12日 82 点赞 0 评论 667 浏览

知了zKnown

原知了阅读，AI-Native 构建的，致力于信息降噪 / 阅读提效的个人知识助手。知了zKnown用 AI 的方式，快速总结文章的关键信息，帮助用户做读前筛选，提高阅读效率。

Ai学习资源 2025年06月05日 55 点赞 0 评论 667 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期