AI模型 - 智狐AI导航

Instella

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持4096标记序列，具备强大的自然语言理解、指令跟随和多轮对话能力。通过多阶段训练和高效优化技术，Instella在多个任务中表现优异，适用于智能客服、内容创作、教育辅导、编程辅助和企业知识管理等多个场景。AMD全面开放了模型资源，促进AI技术发展与社区合作。

AI项目与工具 2025年06月12日 79 点赞 0 评论 696 浏览

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts（MoE）文本大模型，拥有 1420 亿参数，激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练，采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术，提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

AI项目与工具 2025年06月11日 78 点赞 0 评论 695 浏览

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 692 浏览

k1.5

k1.5 是月之暗面推出的多模态思考模型，具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下，性能超越主流模型 550%，在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理，适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化，提升推理效率与准确性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 689 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 686 浏览

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型，擅长处理图像与文本信息，具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异，支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术，提升推理准确性与可解释性，适用于科研、教育、医疗及自动驾驶等场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 686 浏览

Ivy

Ivy-VL是一款专为移动端和边缘设备设计的轻量级多模态AI模型，具备约30亿参数，专注于视觉问答、图像描述及复杂推理等任务，能够有效降低计算资源需求，同时在多模态任务中表现出色，尤其适用于增强现实、智能家居及移动学习等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 685 浏览

SocioVerse

SocioVerse是由复旦大学等机构联合开发的社会模拟平台，基于大语言模型和1000万真实用户数据构建与现实对齐的模拟环境。系统包含社会环境、用户引擎、场景引擎和行为引擎四大模块，支持多场景应用，如政治选举预测、新闻传播分析、经济调查和政策评估。它能够模拟群体行为，预测事件趋势，为社会科学研究提供高效工具。

AI项目与工具 2025年06月11日 80 点赞 0 评论 680 浏览

Sa2VA

Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型，结合SAM2与LLaVA技术，实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务，具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 677 浏览

Topaz Photo AI

Topaz Photo AI 是一款使用人工智能（AI）来提高照片和视频质量的软件。它可以通过先进的技术锐化、去除噪点来提高图像的分辨率。

Ai图片处理 2025年06月05日 12 点赞 0 评论 675 浏览

AI模型

首页

AI模型

列表

默认

浏览次数

发布日期