模型 - 智狐AI导航

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 704 浏览

PixArt-Σ是一款基于扩散Transformer架构（DiT）的文本生成图像模型，专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法，不仅提升了生成图像的保真度，还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品，并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

AI项目与工具 2024年01月01日 82 点赞 0 评论 705 浏览

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架，通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block，结合查询感知的上下文压缩技术，减少计算开销并精准传递关键信息。在128K长度文本上，APB推理速度比Flash Attention快10倍，比Star Attention快1.6倍，适用于多种分布式环境和模型规模，广泛

AI项目与工具 2025年06月12日 64 点赞 0 评论 706 浏览

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型，支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能，适用于自动化任务执行和复杂交互场景。支持云端与本地部署，提供丰富的开发接口，便于集成与扩展。

AI项目与工具 2025年06月12日 33 点赞 0 评论 706 浏览

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型，参数量为968M。它基于LLaVA架构优化，能够处理视觉与文本输入，显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能，广泛应用于内容审核、智能助手、视觉搜索等领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 706 浏览

混元3D v2.5

混元3D v2.5是腾讯推出的高精度3D生成模型，具备超高清建模能力，支持4K纹理和多视图输入，生成更真实的PBR材质模型。其优化的骨骼蒙皮系统提升动画效率，适用于游戏开发、影视制作、电商展示等多个领域，提供多样化的生成模板和参数调节功能，满足专业级3D内容创作需求。

AI项目与工具 2025年06月11日 98 点赞 0 评论 706 浏览

YAYI

YAYI-Ultra是中科闻歌研发的企业级大语言模型，具备多领域专业能力与多模态内容生成能力，支持数学、代码、金融、中医等领域。模型支持超长文本处理、数据分析、任务规划及联网创作，适用于媒体、医疗、财税等行业。采用混合专家架构，结合指令微调技术，在多项评测中表现优异，提供高效、精准的智能化服务。

AI项目与工具 2025年06月12日 25 点赞 0 评论 707 浏览

BriefGPT AI论文速递

BriefGPT AI是一个AI论文速递网站，它可以帮助研究人员快速发现AI领域的最新研究进展。BriefGPT AI每天持续更新顶级会议和期刊上发表的AI相关论文，并提供论文标题、简要摘要以及论文PDF下载链接。

教育学习 2025年06月05日 80 点赞 0 评论 708 浏览

Shots.So

一个免费的在线工具，只需点击几下即可帮助您创建漂亮的样机模型。 Shots.so可以与背景框架和不同的模型（如浏览器、手机、笔记本电脑、手表等）产生很好的效果。

图片处理 2025年06月05日 26 点赞 0 评论 709 浏览

DeepSeek百宝箱

DeepSeek百宝箱是DeepSeek官方维护的GitHub项目，集成了多种支持DeepSeek API的工具和应用，涵盖聊天、知识管理、开发等多个领域。提供开箱即用、详实文档、本地化支持及多平台兼容性，助力开发者高效使用语言模型，提升工作效率。支持模型训练、部署、监控全流程，具备低代码配置、智能上下文感知、毫秒级响应等特性，适用于办公、编程、内容创作等多种场景。

AI项目与工具 2025年06月12日 45 点赞 0 评论 709 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期