评估
HelloBench
HelloBench 是一款开源基准测试工具,专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务,并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用,包括模型开发、学术研究、产品测试等,同时揭示了现有模型在长文本生成中的局限性。
DET Practice
一个专注于多邻国英语测试的在线平台,提供丰富的题库、模拟考试及AI纠正服,帮助用户高效备考多邻国英语测试。