应用 - 智狐AI导航

MobA

MobA是一种基于多模态大型语言模型的移动智能体，通过高级全局智能体（GA）和低级局部智能体（LA）的两级架构，实现任务规划、分解与执行，支持跨应用操作和自动化流程。其反思模块助力高效处理复杂任务，广泛应用于个人助理、智能家居控制、移动设备自动化及教育等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 691 浏览

爱扒谱

爱扒谱是一款基于人工智能技术的在线音乐处理平台，提供一键扒谱、音轨分离、AI音乐生成及MP3转MIDI等功能。它适用于音乐创作者、教师、学生及爱好者，能够显著提升音乐创作效率和学习体验。其主要特点包括高效便捷、智能精准、多平台支持及用户友好性。

AI项目与工具 2025年06月12日 53 点赞 0 评论 826 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 702 浏览

Teacher2Task

Teacher2Task是一个由谷歌团队研发的多教师学习框架，其核心在于引入教师特定的输入标记并重新构建训练过程，以减少对人工聚合方法的依赖。通过将训练数据转化为多个子任务，该框架能够从不同教师的多样化预测中学习，提高模型的性能和鲁棒性，同时降低标签不准确性的风险。它适用于机器翻译、图像理解、自然语言处理等多个领域，显著提升了数据利用效率。

AI项目与工具 2025年06月12日 39 点赞 0 评论 593 浏览

Autoppt

Autoppt是一款基于人工智能技术的演示文稿生成工具，能够根据用户输入的主题快速生成结构化、专业级的PPT文稿。其主要功能包括自动化生成、模板选择、数据可视化、动画效果添加、思维导图生成及多格式导出等，支持个性化定制和团队协作，广泛应用于商务演示、教育培训、项目汇报和个人场景中。

AI项目与工具 2025年06月12日 66 点赞 0 评论 687 浏览

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型，包含文本转语音（Takin TTS）、音色转换（Takin VC）及声音风格变换（Takin Morphing）。它采用最新大型语言模型技术，可生成接近真人的高质量语音，并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域，具有音色精准、风格多样等特点。

AI项目与工具 2025年06月12日 63 点赞 0 评论 606 浏览

ACE

ACE是一款基于扩散Transformer架构的多模态图像生成与编辑工具，通过长上下文条件单元（LCU）和统一条件格式实现自然语言指令的理解与执行。它支持图像生成、编辑、多轮交互等多种任务，适用于艺术创作、媒体制作、广告设计、教育培训等多个领域，提供高效且灵活的视觉内容解决方案。

AI项目与工具 2025年06月12日 74 点赞 0 评论 561 浏览

OpenScholar

OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型，专为科学家设计，能够高效检索并综合海量科学文献信息，生成基于文献的事实性回答。该工具具备强大的跨学科适用性，涵盖计算机科学、生物医学等多个领域，同时支持自我反馈迭代优化，显著提升回答质量和引用可靠性。所有相关资源已完全开源，便于全球学者使用与研究。

AI项目与工具 2025年06月12日 30 点赞 0 评论 859 浏览

GenChess

GenChess是一款由谷歌DeepMind开发的AI工具，允许用户通过关键词生成个性化国际象棋棋子。它提供了经典与创意两种模式，支持单个棋子的独立调整及对手棋子的自动生成，同时兼容在线对弈和棋子图片下载功能，适用于教育、娱乐、创意表达及专业训练等场景。

AI项目与工具 2025年06月12日 54 点赞 0 评论 533 浏览

LongAlign

LongAlign是一种针对文本到图像生成任务的改进方法，通过分段级编码技术和分解偏好优化，有效解决了长文本输入的对齐问题。它能够显著提升生成图像与输入文本的一致性，广泛应用于艺术创作、游戏开发、影视制作及教育等领域，具备高精度和强泛化能力。

AI项目与工具 2025年06月12日 21 点赞 0 评论 509 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期