训练 - 智狐AI导航

LongVU

LongVU是一款由Meta AI团队研发的长视频理解工具，其核心在于时空自适应压缩机制，可有效减少视频标记数量并保留关键视觉细节。该工具通过跨模态查询与帧间依赖性分析，实现了对冗余帧的剔除及帧特征的选择性降低，并基于时间依赖性进一步压缩空间标记。LongVU支持高效处理长视频，适用于视频内容分析、搜索索引、生成描述等多种应用场景。

AI项目与工具 2025年06月12日 65 点赞 0 评论 625 浏览

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型，专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能，并基于 Transformer 架构实现。它在多个基准测试中表现出色，适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 624 浏览

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型，兼具高性能与低成本优势，适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理，可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域，具备良好的扩展性和系统集成能力。

AI项目与工具 2025年06月11日 76 点赞 0 评论 624 浏览

Baichuan

Baichuan-NPC（百川角色大模型）是一款由百川智能公司推出的智能角色模型，通过文本描述即可生成具有生动表现力的角色智能体。该模型在“角色知识”与“对话能力”方面进行了深度优化，确保角色能更准确地理解对话语境，并根据角色性格进行交流和互动。主要功能包括高效对话能力、高度定制角色创建、严格的事实性回复、高质量数据预训练及思维链对齐技术。

AI项目与工具 2024年01月01日 23 点赞 0 评论 623 浏览

SpatialVLA

SpatialVLA是一款由多机构联合研发的空间具身通用操作模型，具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术，实现精准的环境感知与动作生成。支持零样本任务执行与快速微调，适用于工业、物流、医疗等多个领域，推动机器人技术的发展与应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 622 浏览

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架，通过与高级模型API交互获取数据对，结合预训练的视觉语言模型（VLMs）动态优化训练集，大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练，显著提升了生成图像的质量和多样性，广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 621 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 621 浏览