评估

HMA

HMA(Heterogeneous Masked Autoregression)是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法,支持离散与连续生成模式,可处理不同动作空间的异构性。该工具具备高效实时交互能力,广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域,适用于机器人学习与控制任务,提升策略泛化与执行效率。

Pixian.AI

Pixian.AI是一款基于人工智能的一键抠图工具,特别适合需要快速、高质量处理图片背景的用户。该工具无需订阅,提供高效且经济的解决方案,尤其在Beta测试阶段,用户可以免费使用。...

SciTE AI

一个帮助研究人员发现和理解研究文章的平台,通过展示文章的引用情况来帮助用户了解文章的上下文。

potis.ai

Potis.ai 是一款基于 AI 技术的招聘平台,通过自动化行为面试、智能面试协助和人才评分系统,帮助企业提升招聘效率,降低时间和成本支出。平台支持无缝集成至现有流程,提供详尽的候选人反馈和团队协作优化功能,适用于远程招聘、大规模招聘及技术岗位评估等多种场景。

LightEval

LightEval是一款由Hugging Face开发的轻量级AI评估工具,旨在评估大型语言模型。它支持多设备运行,包括CPU、GPU和TPU,具备多任务处理能力和自定义评估功能。LightEval与Hugging Face的生态系统集成,便于模型管理和共享。适用于企业、科研人员及教育机构。

CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)的推理效率与准确性。该框架通过动态切换短答案和长形式推理,根据模型对答案的置信度(PPL)决定是否进行详细推理,从而在保证准确性的同时节省计算资源。CAR适用于视觉问答(VQA)、关键信息提取(KIE)等任务,在数学

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台,EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性,简化工作流程,增强团队信心,确保

PaperBench

PaperBench是OpenAI开发的AI智能体评测基准,用于评估其复现顶级机器学习论文的能力。它涵盖从理解论文、编写代码到执行实验的全流程,具备8316个评分节点和自动评分系统。支持多种智能体配置,提供标准化测试环境,适用于模型优化、学术验证及教育实践等领域,推动AI研究的标准化发展。

VirSci

VirSci是一款基于大型语言模型(LLMs)的多智能体AI科学研究工具,通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等,支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持,广泛应用于科学研究、团队协作、教育和项目管理等领域。

Stocknear

Stocknear是一款利用AI技术的在线股票分析平台,提供股票评级、价格预测、市场情绪分析、财务数据展示及技术图表分析等功能。它能够帮助投资者深入了解股票市场动态,辅助其做出更明智的投资决策。Stocknear特别适合个人投资者、市场研究人员以及新手投资者使用,支持从基础学习到专业操作的多样化需求。 ---