AI项目与工具

Lamucal

Lamucal是一款由人工智能驱动的音乐创作工具，主要功能包括实时生成歌曲的和弦、吉他谱、歌词及旋律，支持AI翻唱、人声移除和音轨分离等操作。它不仅适用于个人音乐学习和音乐教育，还能满足音乐制作人和内容创作者的需求，广泛覆盖音乐创作、教学及娱乐场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 604 浏览

Fluig

Fluig 是一款基于 AI 的图表生成工具，可将文字、文档或代码快速转化为多种专业图表，如思维导图、流程图等。支持多模态输入和智能格式转换，操作简便，适合无设计背景的用户使用。提供实时协作功能，适用于教育、商业、研究等多个场景，提升信息可视化与团队协作效率。

AI项目与工具 2025年06月11日 35 点赞 0 评论 604 浏览

彩漩

彩漩是一款基于AI技术的PPT制作平台，支持一键生成高质量演示文稿，提供智能配图、内容优化及多人协作功能。平台具备安全分享机制，支持多种格式转换和数据追踪，适用于教育、企业培训及市场营销等多种场景，兼容多端使用，提升内容创作与传播效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 604 浏览

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 604 浏览

Aria

Aria是首个开源多模态原生混合专家（MoE）模型，支持文本、代码、图像和视频的综合处理，具有强大的多模态任务处理能力和长上下文窗口，可高效应对复杂长数据。模型开源且可扩展，适用于多模态AI领域的研究与应用。

AI项目与工具 2025年06月12日 48 点赞 0 评论 605 浏览

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具，能够将UI截图转换为结构化数据，通过识别可交互图标和提取功能语义，提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用，无需依赖额外信息，适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 605 浏览

RegionDrag

RegionDrag是一种基于区域的图像编辑技术，由香港大学和牛津大学联合开发。该技术利用扩散模型，让用户通过定义手柄区域和目标区域来实现快速且精确的图像编辑。RegionDrag在单次迭代中完成编辑任务，显著减少编辑时间，同时采用注意力交换技术增强编辑的稳定性和自然性。主要应用领域包括数字艺术与设计、照片编辑、虚拟现实、游戏开发以及电影和视频制作等。

AI项目与工具 2025年06月12日 16 点赞 0 评论 605 浏览