评估 - 智狐AI导航

MagicSchool AI

MagicSchool AI 是一款利用生成式AI的工具，旨在帮助教师在课堂中应用生成式AI。

教育学习 2025年06月05日 30 点赞 0 评论 680 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 686 浏览

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 694 浏览

VirSci

VirSci是一款基于大型语言模型（LLMs）的多智能体AI科学研究工具，通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等，支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持，广泛应用于科学研究、团队协作、教育和项目管理等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 699 浏览

SmartPrep AI

新一代课程规划简化，释放无限创造力，减少重复性任务，SmartPrep AI让您有更多时间专注于教学！

教育学习 2025年06月05日 11 点赞 0 评论 703 浏览

SciTE AI

一个帮助研究人员发现和理解研究文章的平台，通过展示文章的引用情况来帮助用户了解文章的上下文。

教育学习 2025年06月05日 46 点赞 0 评论 709 浏览

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台，EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性，简化工作流程，增强团队信心，确保

Ai平台模型 2025年06月05日 38 点赞 0 评论 712 浏览

potis.ai

Potis.ai 是一款基于 AI 技术的招聘平台，通过自动化行为面试、智能面试协助和人才评分系统，帮助企业提升招聘效率，降低时间和成本支出。平台支持无缝集成至现有流程，提供详尽的候选人反馈和团队协作优化功能，适用于远程招聘、大规模招聘及技术岗位评估等多种场景。

AI项目与工具 2025年06月12日 63 点赞 0 评论 713 浏览

HMA

HMA（Heterogeneous Masked Autoregression）是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法，支持离散与连续生成模式，可处理不同动作空间的异构性。该工具具备高效实时交互能力，广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域，适用于机器人学习与控制任务，提升策略泛化与执行效率。

AI项目与工具 2025年06月12日 22 点赞 0 评论 718 浏览

PaperBench

PaperBench是OpenAI开发的AI智能体评测基准，用于评估其复现顶级机器学习论文的能力。它涵盖从理解论文、编写代码到执行实验的全流程，具备8316个评分节点和自动评分系统。支持多种智能体配置，提供标准化测试环境，适用于模型优化、学术验证及教育实践等领域，推动AI研究的标准化发展。

AI项目与工具 2025年06月12日 31 点赞 0 评论 719 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期