模型 - 智狐AI导航

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 570 浏览

FantasyTalking

FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具，能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略，结合面部专注的交叉注意力模块和运动强度调制模块，实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态，适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

AI项目与工具 2025年06月11日 83 点赞 0 评论 657 浏览

BrowseComp

BrowseComp 是 OpenAI 开源的 AI 浏览能力评估基准，包含 1266 个高难度问题，覆盖多个领域。它要求 AI 代理进行多步骤推理和跨网站信息整合，测试其搜索、分析和适应能力。Deep Research 模型在其中表现优异，准确率达 51.5%。该工具适用于企业知识库、电商导购、政府服务及 AI 研究等领域，推动智能浏览技术发展。

AI项目与工具 2025年06月11日 50 点赞 0 评论 750 浏览

日日新SenseNova V6

日日新SenseNova V6是商汤科技推出的第六代多模态大模型，基于6000亿参数架构，支持文本、图像、视频的原生融合。具备强推理、长记忆与情感表达能力，适用于视频分析、教育辅导、智能客服、具身智能等多个领域，提升交互体验与内容处理效率。

AI项目与工具 2025年06月11日 19 点赞 0 评论 736 浏览

明岐

明岐是上海交通大学LoCCS实验室开发的医学多模态大模型，专注于罕见病精准诊断。它整合影像、病历与化验数据，采用双引擎架构实现高精度、可解释的诊断，准确率超92%。通过模型优化技术，支持低成本本地化部署，适用于基层医疗、远程服务及科研教学，助力医疗资源均衡发展。

AI项目与工具 2025年06月11日 28 点赞 0 评论 917 浏览

AgentPrune

AgentPrune 是一种针对大型语言模型驱动的多智能体系统的通信优化框架，通过“剪枝”技术减少冗余通信内容，降低通信成本并提升系统性能。其核心技术包括时空图建模、低秩稀疏图掩码和一次性剪枝，可在 AutoGen 和 GPTSwarm 等框架中无缝集成，实现高达 72.8% 的 token 减少。同时具备对抗攻击防御能力，适用于复杂任务协作和工业级应用。

AI项目与工具 2025年06月11日 27 点赞 0 评论 705 浏览

UNO

UNO是字节跳动推出的AI图像生成框架，支持单主体和多主体图像生成，解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术，结合通用旋转位置嵌入（UnoPE），实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域，具备强大泛化能力，已开源并提供完整技术文档。

AI项目与工具 2025年06月11日 23 点赞 0 评论 878 浏览

HoloPart

HoloPart 是一种基于扩散模型的 3D 分割工具，能准确识别并补全被遮挡的语义部件，支持几何与材质编辑等任务。其两阶段方法结合局部与全局注意力机制，提升分割精度与一致性。适用于动画制作、几何优化及数据生成等领域，已在多个数据集上取得优异性能。

AI项目与工具 2025年06月11日 84 点赞 0 评论 663 浏览

The AI Scientist

The AI Scientist-v2 是一个端到端的 AI 系统，能够自主完成从提出科学假设到撰写论文的全流程科研任务。它采用基于代理的树搜索方法，提高科学探索效率，并结合视觉-语言模型优化内容质量。该系统已成功生成并通过同行评审的 AI 论文，标志着 AI 在科学研究领域的重大突破。适用于科研自动化、机器学习、跨学科研究及教育等多个场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 652 浏览

Z.ai

Z.ai 是智谱推出的 AI 模型体验平台，整合 GLM 系列的基座、推理和沉思模型，支持 HTML、SVG 等内容的可视化生成与预览。平台提供免费体验，适用于代码生成、问题解答、研究写作、内容创作及教育辅助等多种场景，具备高效、易用和多用途的特点。

AI项目与工具 2025年06月11日 34 点赞 0 评论 606 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期