应用 - 智狐AI导航

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型，旨在提升图形用户界面（GUI）助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用，实现了高效的零样本截图定位和GUI自动化功能，广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 764 浏览

tldraw

tldraw是一款开源的无限画布工具，支持多人实时协作，适用于团队设计、项目管理和教育等领域。它提供了手绘风格、智能箭头、捕捉和便签等功能，以及丰富的绘图工具如画笔、橡皮擦、线框和文本工具，用户可在无限画布上自由创作，不受空间限制。

AI项目与工具 2025年06月12日 26 点赞 0 评论 748 浏览

Talker

Talker-Reasoner是一种结合了直觉与逻辑推理能力的双模块AI代理架构，由谷歌DeepMind研发。它通过Talker模块快速生成自然语言回应，以及Reasoner模块执行复杂的逻辑推理和规划，实现了高效的任务处理和自然的人机交互。该架构支持多步推理、信念状态管理及上下文感知，适用于客户服务、健康管理、教育辅导等多个领域。

AI项目与工具 2025年06月12日 25 点赞 0 评论 806 浏览

GenFM

GenFM是一款由ElevenLabs开发的AI工具，可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言，具备自动化声音选择、人性化填充词添加及高度定制化功能，适用于教育、播客制作、有声书创作、商业推广等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 614 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 738 浏览

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架，专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标，采用解耦评测与推理的设计，提供统一的评测流程，集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 529 浏览

腾讯混元文生视频

腾讯混元文生视频是一款利用AI技术生成高质量视频内容的工具，可根据文本提示生成具有大片质感的视频。它支持多语言输入，涵盖高清画质、流畅镜头切换及自然场景模拟等功能，适用于电影制作、广告设计、教育培训等多种应用场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 697 浏览

360Zhinao2

360Zhinao2-7B是一款由360公司开发的大规模AI语言模型，具备强大的语言理解和生成能力，支持多语言交流和复杂的数学逻辑推理。其核心特性包括灵活的上下文处理、高效的训练技术和广泛的适用性，可应用于智能客服、教育辅助、内容创作和信息检索等多个领域。

AI项目与工具 2025年06月12日 89 点赞 0 评论 858 浏览

EfficientTAM是一款由Meta AI研发的轻量级视频对象分割与跟踪模型，基于非层次化Vision Transformer（ViT）构建，通过引入高效记忆模块显著降低了计算复杂度。它能够实现高质量的视频对象分割与多目标跟踪，同时保持较低的延迟和较小的模型尺寸，特别适用于移动设备上的实时视频处理。该模型已在多个视频分割基准测试中表现出色，并支持多种应用场景，包括移动视频编辑、视频监控、增强现

AI项目与工具 2025年06月12日 65 点赞 0 评论 668 浏览

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术，能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状，并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域，为个性化定制提供了强大的技术支持。

AI项目与工具 2025年06月12日 23 点赞 0 评论 609 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期