模型 - 智狐AI导航

Vid2World

Vid2World是由清华大学和重庆大学联合开发的创新框架，能够将全序列、非因果的被动视频扩散模型（VDM）转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术，解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理，适用于机器人操作、游戏模拟等复杂环境，具有广泛的应用前景。

AI项目与工具 2025年06月11日 33 点赞 0 评论 705 浏览

o3

o3-pro 是 OpenAI 开发的高级推理模型，继承并优化了 o3 的功能，在复杂问题解决和精确答案提供上表现出色。它集成了 ChatGPT 的多种工具，如网页搜索、文件分析、图像推理和编程等，适合科学研究、编程、教育和写作等领域。尽管响应速度稍慢，但在表达清晰度、逻辑准确性和答案完整性方面表现优异，并在数学、科学和编程等领域的性能上超越了前代模型。

AI项目与工具 2025年06月12日 44 点赞 0 评论 705 浏览

DreamGen

DreamGen是英伟达推出的机器人学习技术，基于AI视频世界模型生成合成数据，使机器人能在梦境中学习新技能。它通过微调视频世界模型、生成虚拟数据、提取虚拟动作和训练下游策略四步流程，实现机器人在新环境中的行为和环境泛化。DreamGen无需大量真实数据，仅凭文本指令即可完成复杂任务，提升学习效率和泛化能力。其支持多种机器人系统和策略架构，适用于工业生产、家庭服务、医疗护理等多个领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 704 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 704 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 704 浏览

VoxCraft Ai

北京生数科技有限公司开发的一款强大的AI生成3D工具，VoxCraft Ai基于底层通用多模态大模型，具备优越的多模态生成能力。

3D&游戏 2025年06月05日 22 点赞 0 评论 703 浏览

Llama 4 是 Meta 推出的多模态 AI 模型系列，采用混合专家（MoE）架构，提升计算效率。包含 Scout 和 Maverick 两个版本，分别适用于不同场景。Scout 支持 1000 万 token 上下文，Maverick 在图像理解和创意写作方面表现优异。Llama 4 支持 200 种语言，具备强大的语言生成与多模态处理能力，适用于对话系统、文本生成、代码辅助、图像分析等多个

AI项目与工具 2025年06月12日 46 点赞 0 评论 703 浏览

START

START是由阿里巴巴集团与中科大联合研发的工具增强型推理模型，通过集成外部工具（如Python代码执行器）提升大型语言模型的推理能力。其核心在于“Hint-infer”和“Hint-RFT”技术，结合长链推理与工具调用，显著提高复杂数学、科学问题及编程任务的准确性和效率。该模型具备自我调试、多策略探索和自学习能力，适用于科研、教育、编程等多个领域，是首个开源的长链推理与工具集成模型。

AI项目与工具 2025年06月12日 72 点赞 0 评论 703 浏览

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型，拥有十亿参数量，可自主完成复杂任务，如调酒和遛狗。该模型基于模仿学习，具备强大的泛化能力和操作精度，支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景，推动机器人技术发展。

AI项目与工具 2025年06月12日 83 点赞 0 评论 703 浏览

SAC

SAC-KG是一个基于大型语言模型（LLMs）的框架，用于自动化构建领域知识图谱。它包含生成器、验证器和剪枝器三大组件，能从原始语料库生成高精度的特定领域知识图谱，适用于医学、生物学等专业领域。SAC-KG支持大规模数据处理，其精度可达89.32%，显著优于现有方法。

AI项目与工具 2025年06月12日 65 点赞 0 评论 702 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期