评估 - 智狐AI导航

Pixian.AI

Pixian.AI是一款基于人工智能的一键抠图工具，特别适合需要快速、高质量处理图片背景的用户。该工具无需订阅，提供高效且经济的解决方案，尤其在Beta测试阶段，用户可以免费使用。...

图片处理 2026年06月21日 0 点赞 0 评论 720 浏览

FullStack Bench

FullStack Bench是一款由字节跳动与M-A-P社区联合推出的专业代码评估工具，主要针对全栈编程和多语言编程能力进行评估。它包含11种真实编程场景、3374个问题以及16种编程语言，具备全面评估、多语言支持、实际场景模拟、代码质量控制等特点，适用于代码智能评估、教育与培训、研究开发、软件测试及多语言编程能力评估等多个场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 722 浏览

Stocknear

Stocknear是一款利用AI技术的在线股票分析平台，提供股票评级、价格预测、市场情绪分析、财务数据展示及技术图表分析等功能。它能够帮助投资者深入了解股票市场动态，辅助其做出更明智的投资决策。Stocknear特别适合个人投资者、市场研究人员以及新手投资者使用，支持从基础学习到专业操作的多样化需求。 ---

AI项目与工具 2025年06月12日 42 点赞 0 评论 723 浏览

CAR（Certainty-based Adaptive Reasoning）是字节跳动联合复旦大学推出的自适应推理框架，旨在提升大型语言模型（LLM）和多模态大型语言模型（MLLM）的推理效率与准确性。该框架通过动态切换短答案和长形式推理，根据模型对答案的置信度（PPL）决定是否进行详细推理，从而在保证准确性的同时节省计算资源。CAR适用于视觉问答（VQA）、关键信息提取（KIE）等任务，在数学

AI项目与工具 2025年06月11日 73 点赞 0 评论 727 浏览

AndroidLab

AndroidLab 是一款面向 Android 自主代理的训练与评估框架，集成了文本和图像模态操作环境，提供标准化的基准测试任务。它通过支持多种模型类型（LLMs 和 LMMs），覆盖九个应用场景的 138 项任务，有效提升了开源模型的性能。此外，AndroidLab 提供了丰富的评估指标和操作模式，助力研究者优化模型表现并推动开源解决方案的发展。

AI项目与工具 2025年06月12日 38 点赞 0 评论 731 浏览

多面

多面是一款基于AI技术的招聘平台，提供AI在线面试、智能评估与模拟面试等功能，助力求职者提升面试能力，帮助企业高效筛选人才。平台支持多种招聘场景，具备智能管理、简历解析、批量邀约等实用功能，提升招聘效率与精准度。

AI项目与工具 2025年06月12日 39 点赞 0 评论 735 浏览

LongReward

LongReward是一种由清华大学、中国科学院及智谱AI联合开发的AI工具，专注于通过多维度评估（有用性、逻辑性、忠实性和完整性）来优化长文本大型语言模型的表现。它利用现成的语言模型提供奖励信号，并结合强化学习算法改善模型性能，特别擅长处理复杂长文本任务，如文档理解、摘要生成及特定领域的数据分析，如法律、金融和医疗。

AI项目与工具 2025年06月12日 71 点赞 0 评论 740 浏览

HIRING.STUDIO

HIRING.STUDIO是一款基于AI技术的面试问题生成平台，专注于优化招聘流程。其核心功能包括智能生成职位相关问题、提供后续问题建议、生成评估标准以及支持多种答案评估模式（如STAR方法）。该工具不仅提升了面试准备的效率和一致性，还增强了面试官对候选人的评价客观性，适用于技术面试、行为面试及团队协作场景，尤其适合校园招聘和远程面试等多样化招聘需求。

AI项目与工具 2025年06月12日 25 点赞 0 评论 742 浏览

Collaborative Gym

Collaborative Gym（Co-Gym）是一款支持人机协作的开发框架，具备异步交互、任务环境设计和多维评估功能。它通过模拟与真实环境支持开发者进行高效迭代与实际部署，适用于旅行规划、表格分析和文献综述等多种协作任务，提升人机协作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 742 浏览

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具，包含数据库（VE-Bench DB）和量化评估模块（VE-Bench QA）。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性，旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 742 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期