评估 - 智狐AI导航

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台，EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性，简化工作流程，增强团队信心，确保

Ai平台模型 2025年06月05日 38 点赞 0 评论 712 浏览

SciTE AI

一个帮助研究人员发现和理解研究文章的平台，通过展示文章的引用情况来帮助用户了解文章的上下文。

教育学习 2025年06月05日 46 点赞 0 评论 709 浏览

SmartPrep AI

新一代课程规划简化，释放无限创造力，减少重复性任务，SmartPrep AI让您有更多时间专注于教学！

教育学习 2025年06月05日 11 点赞 0 评论 703 浏览

VirSci

VirSci是一款基于大型语言模型（LLMs）的多智能体AI科学研究工具，通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等，支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持，广泛应用于科学研究、团队协作、教育和项目管理等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 699 浏览

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 694 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 686 浏览

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台，专为评估和分析大型语言模型（LLMs）在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持，旨在为研究人员和开发者提供一个直观且高效的工具，用于测试和优化智能体在复杂交互环境中的表现。

AI项目与工具 2025年06月12日 20 点赞 0 评论 680 浏览

MagicSchool AI

MagicSchool AI 是一款利用生成式AI的工具，旨在帮助教师在课堂中应用生成式AI。

教育学习 2025年06月05日 30 点赞 0 评论 680 浏览

SocioVerse

SocioVerse是由复旦大学等机构联合开发的社会模拟平台，基于大语言模型和1000万真实用户数据构建与现实对齐的模拟环境。系统包含社会环境、用户引擎、场景引擎和行为引擎四大模块，支持多场景应用，如政治选举预测、新闻传播分析、经济调查和政策评估。它能够模拟群体行为，预测事件趋势，为社会科学研究提供高效工具。

AI项目与工具 2025年06月11日 80 点赞 0 评论 679 浏览

ARCHITEChTURES

ARCHITEChTURES是一个基于AI的建筑设计平台，专注于自动化处理建筑设计中的重复性任务，如建模、测量和计算，以提高设计效率和质量。它支持多户型住宅建筑设计，提供CAD和BIM绘图功能，并具备测量、预算以及快速设计与共享能力。此外，平台还支持多种应用场景，包括可行性研究、场地规划、商业评估和概念迭代等。

AI项目与工具 2025年06月12日 34 点赞 0 评论 674 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期