学习 - 智狐AI导航

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架，支持文本、图像、视频等多种输入形式，简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力，适用于视频监控、内容推荐、教育辅助等场景，提升设备智能化水平和用户体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 730 浏览

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架，支持多模态输入（如图片、文字、视频等）生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化，具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景，有效降低音乐创作门槛，提升创作效率与个性化体验。

AI项目与工具 2025年06月12日 77 点赞 0 评论 531 浏览

MatterGen

MatterGen是由微软开发的生成式AI模型，专注于无机材料的设计与生成。它通过扩散过程逐步优化原子结构，生成稳定、多样化且符合特定性能要求的材料。支持化学组成、磁性、电子和机械性能等多维度约束，适用于逆向材料设计，提升新材料研发效率。已应用于能源、催化、电子等领域，推动材料科学进步。

AI项目与工具 2025年06月12日 16 点赞 0 评论 623 浏览

ParGo

ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器，通过结合局部与全局token，提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息，增强细节感知能力。在多个基准测试中表现优异，尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略，提高模型泛化能力，适用于视觉问答、图像字幕生成、跨模态检索等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 861 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 782 浏览

豆包AI编程

豆包AI编程是一款基于AI技术的编程辅助工具，支持一键上传代码、实时接入GitHub项目，并提供沉浸式代码阅读和精准提问功能。它能生成、解释、修复和优化代码，提升编程效率与理解力，适用于学习、开发、代码审查及团队协作等场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 587 浏览

Step R

Step R-mini是一款由阶跃星辰推出的推理模型，具备主动规划、尝试与反思能力，适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制，支持深度推理与多步骤验证，表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长，实现文理兼修，广泛应用于教育、科研、企业办公等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 524 浏览

Loora

Loora是一款AI驱动的英语口语学习工具，通过模拟真实场景帮助用户提升英语表达能力。支持商务、面试、日常交流等多场景练习，提供实时发音、语法及流利度反馈。具备24小时可用性、个性化课程设计、语音识别与翻译功能，并支持学习进度跟踪，适用于各类英语学习者。

AI项目与工具 2025年06月12日 30 点赞 0 评论 689 浏览

Monoxer Junior

Monoxer Junior是一款由日本公司Monoxer开发的AI学习应用，专为小学新生设计。它基于人工智能技术，根据儿童的学习水平和记忆状态智能生成练习题，涵盖假名、汉字等内容，支持家庭和学校使用。应用具备学习进度可视化功能，便于家长了解孩子学习情况。目前已在日本超过3400家教育机构推广，用户超500万，有效提升学习效率和兴趣。

AI项目与工具 2025年06月12日 43 点赞 0 评论 919 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 746 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期