评估 - 智狐AI导航

FoloUp

FoloUp 是一款开源的 AI 语音面试平台，能根据职位描述自动生成面试问题，并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成，提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘，结合语音识别、NLP 和安全数据管理技术，适用于多种招聘场景，提升招聘效率与质量。

AI项目与工具 2025年06月12日 74 点赞 0 评论 777 浏览

SuperGPQA

SuperGPQA是由字节跳动豆包团队与M-A-P联合开发的知识推理基准测试集，覆盖285个研究生级学科，包含26529道题目。其核心功能是评估大语言模型的泛化能力和真实推理水平，42.33%的题目涉及数学计算或形式推理。该测试集采用专家与大语言模型协同构建的方式，确保题目质量，并涵盖STEM与非STEM领域，填补了长尾学科评估的空白。适用于模型性能评估、优化指导及跨学科研究等多种应用场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 768 浏览

SmartPrep.AI

SmartPrep.AI是一款基于AI的大模型教学辅助平台，专为教师和学生提供智能化解决方案。其核心功能涵盖智能课程计划生成、多源教学资源整合、可定制化评估工具等，支持多种教学方法并实现个性化定制。此外，它还适用于日常备课、跨学科项目设计、新教师培训以及远程教学等多种场景，显著提升教育工作的效率与效果。

AI项目与工具 2025年06月12日 63 点赞 0 评论 760 浏览

Agent K v1.0

Agent K v1.0 是一款端到端自主数据科学智能体，由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节，支持多模态数据处理，具备动态多步骤问题解决能力，并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异，广泛应用于金融、医疗、零售、制造及客户服务等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 750 浏览

North

North 是 Cohere 推出的企业级 AI 工作平台，提供安全、高效的 AI 解决方案，支持私有云或本地部署。内置 Compass 搜索系统，可处理多种数据类型并支持多语言，提升任务效率。平台集成了高性能语言模型和自动化工具，适用于金融、医疗等行业，可用于风险评估、客户支持、疾病诊断、药物研发等多个场景，增强企业智能化水平。

AI项目与工具 2025年06月12日 60 点赞 0 评论 746 浏览

咕噜口语SpeakGuru

SpeakGuru是一款由清华团队开发的AI口语练习工具，通过与虚拟人物对话提升英语口语能力。支持中文辅助、语法优化、发音评估等功能，涵盖100+真实场景，适配不同英语水平用户。内置错题本、词汇统计、个性化学习计划等模块，帮助用户全面掌握学习进度。已接入DeepSeek R1模型，提升智能化学习体验。

AI项目与工具 2025年03月17日 78 点赞 0 评论 744 浏览

CodeGemma

CodeGemma是由Google开发的大型语言模型系列，专注于代码生成和理解。它包含三种不同规模的模型：2B预训练模型、7B预训练模型和7B指令微调模型。CodeGemma支持多种编程语言，能够提供代码补全、生成和自然语言理解等功能。经过大量英语编程和数学数据的训练，CodeGemma具备高准确性，能够在多种编程语言中表现出色，并能集成到各种开发环境中，提高开发效率。

AI项目与工具 2024年01月01日 65 点赞 0 评论 743 浏览

HIRING.STUDIO

HIRING.STUDIO是一款基于AI技术的面试问题生成平台，专注于优化招聘流程。其核心功能包括智能生成职位相关问题、提供后续问题建议、生成评估标准以及支持多种答案评估模式（如STAR方法）。该工具不仅提升了面试准备的效率和一致性，还增强了面试官对候选人的评价客观性，适用于技术面试、行为面试及团队协作场景，尤其适合校园招聘和远程面试等多样化招聘需求。

AI项目与工具 2025年06月12日 25 点赞 0 评论 742 浏览

Collaborative Gym

Collaborative Gym（Co-Gym）是一款支持人机协作的开发框架，具备异步交互、任务环境设计和多维评估功能。它通过模拟与真实环境支持开发者进行高效迭代与实际部署，适用于旅行规划、表格分析和文献综述等多种协作任务，提升人机协作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 741 浏览

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具，包含数据库（VE-Bench DB）和量化评估模块（VE-Bench QA）。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性，旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 741 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期