学习

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

VideoCrafter2

VideoCrafter2 是一款由腾讯AI实验室开发的视频生成模型,通过将视频生成过程分解为运动和外观两个部分,能够在缺乏高质量视频数据的情况下,利用低质量视频保持运动的一致性,同时使用高质量图像提升视觉质量。该工具支持文本到视频的转换,生成高质量、具有美学效果的视频,能够理解和组合复杂的概念,并模拟不同的艺术风格。

EasyAI

EasyAI,产品经理的人工智能学习库,用通俗易懂的方式帮助产品经理快速学习人工智能相关知识,让非技术人群也能快速理解人工智能。

NextAI整理全球AI项目库

NextAI整理全球AI项目库,包括AI变现: 如何利用AI搞钱、推荐课、Prompt提示词网站、AI学习文章和资料、AI工具汇总&报告收集、国内干模大战申请链接、AI部署公益咨询

OMNE Multiagent

OMNE Multiagent是一个基于长期记忆技术的大模型多智能体框架,由天桥脑科学研究院开发。它支持多个智能体协同工作,每个智能体能独立学习和理解环境,具备深度慢思考和实时适应能力。OMNE框架通过优化搜索空间和逻辑推理机制,提升了复杂问题的决策效率,并在金融、交通、制造、医疗等领域展现出广泛应用潜力。

Mobile

Mobile-Agent 是一种具备移动能力的智能代理系统,能够跨设备执行任务并优化资源使用。基于多模态大语言模型和视觉感知技术,支持自动操作、自我规划与反思,适用于多应用协同、跨平台操作及纯视觉交互。其技术架构包含多个智能体协作机制,提升了移动设备任务处理的效率与灵活性。

密歇根大学安娜堡分校

密歇根大学安娜堡分校(University of Michigan, Ann Arbor),也译作密西根大学安娜堡分校,于1817年建校 ,是密歇根大学系统的旗舰校区。因此通常“密歇根大学”就能代指“密歇根大...

4EVERChat

一个多功能聊天平台,支持不少先进的AI模型。用户能按需挑选,还能同时和多个模型交流。它很注重隐私,能保障用户数据安全。

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

Databricks SQL

Databricks SQL 是一款基于湖仓架构的智能数据仓库服务,支持统一的数据分析、自然语言查询和自动化优化。它通过 Delta Lake 和 Unity Catalog 实现高性能数据处理和元数据管理,适用于数据仓库现代化、实时分析、数据探索及预测建模等场景。