评估 - 智狐AI导航

天目

天目是一款由人民网开发的AI内容检测工具，能够准确识别文本中由人工智能生成的内容，准确率达到93%。该工具支持DOC和TXT格式文件，能够处理高达10万字的文本。它通过高亮显示AI生成的句段，并生成PDF格式的检测报告，方便用户查阅和分享。同时，天目承诺不保存任何用户数据，确保用户数据的安全与隐私。

AI项目与工具 2025年06月12日 83 点赞 0 评论 600 浏览

Umax

Umax是一款基于AI的面部分析工具，通过上传自拍照提供颜值评分、面部特征分析及个性化改进建议。具备进度跟踪、虚拟化妆、滤镜等功能，帮助用户提升外貌与自信。适用于日常美容、自我提升及美学学习，适合关注形象管理的用户。

AI项目与工具 2025年06月12日 88 点赞 0 评论 592 浏览

MMSearch

MMSearch 是一款用于评估大型多模态模型（LMMs）搜索能力的基准测试工具，包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结，通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异，且增加计算量比扩大模型规模更具优势。

AI项目与工具 2025年06月12日 44 点赞 0 评论 591 浏览

LMArena AI

前身为lmsys.org，是一个专注于众包AI基准测试的开放平台，用户可以在此平台上免费与AI聊天并进行投票，比较和测试不同的AI聊天机器人。

Ai平台模型 2025年06月05日 13 点赞 0 评论 591 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 590 浏览

HealthBench

HealthBench是OpenAI推出的开源医疗评估工具，用于衡量大型语言模型在医疗保健领域的表现和安全性。它包含5000个由医生设计的多轮对话，涵盖多种健康场景，并通过多维度评分标准评估模型的准确性、沟通质量等。支持按主题和行为维度进行细分分析，帮助开发者识别模型优势与不足，指导优化方向。适用于模型性能评估、安全测试及医疗AI工具选择。

AI项目与工具 2025年06月11日 79 点赞 0 评论 585 浏览

Screenify

Screenify是一款AI驱动的面试工具，帮助企业优化招聘流程。通过自动化面试创建、智能评估和远程面试功能，提升筛选效率与公平性。支持多语言、个性化配置及与ATS系统集成，提供详细反馈和分析，助力企业精准选才。

AI项目与工具 2025年06月11日 12 点赞 0 评论 577 浏览

微点智能考试系统

高效有趣的智能考试系统，用人工智能将任何内容变成有趣的考试，让企业组织的信息传递和培训学习更高效。

教育学习 2025年06月05日 40 点赞 0 评论 576 浏览

口语精灵

口语精灵是一款基于人工智能的英语口语学习工具，提供1V1智能对话练习，涵盖生活、工作、考试等多场景，支持多种英语口音。其具备发音评估、语法纠错、语句优化等功能，帮助用户提升口语表达的准确性和自然度。同时，该工具提供个性化学习方案和考试备考支持，适用于不同学习阶段的用户。

AI项目与工具 2025年06月12日 61 点赞 0 评论 574 浏览

Genie 2

Genie 2是一款由DeepMind开发的大规模基础世界模型，其核心功能包括基于单一图片生成可交互3D游戏世界、模拟物体交互及物理效果、支持多类型动作控制、具备长时间记忆能力以及实时生成新场景内容。该工具不仅适用于智能体训练与评估，还广泛应用于游戏开发、模拟与训练、机器人学习以及虚拟现实和增强现实等领域。

AI项目与工具 2025年06月12日 40 点赞 0 评论 568 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期

天目