评估

SocraticLM

SocraticLM 是一款基于苏格拉底教学法的人工智能模型,由中科大与科大讯飞联合开发。它通过提问引导学生主动思考,具备多轮对话能力和个性化教学功能。模型在 SocraTeach 数据集上训练,教学性能优于 GPT-4,整体质量提升 12%。其综合评估系统涵盖五项教学维度,适用于数学教学、个性化辅导及在线教育平台,为教育技术发展提供了新思路。

ImBD

ImBD是一种用于检测机器修订文本的AI工具,采用风格偏好优化(SPO)和风格条件概率曲率(Style-CPC)技术,能有效区分人类写作与机器修订内容。该工具具备多场景适应能力,支持多种文本类型和领域,训练效率高、数据需求低,适用于学术、新闻、出版、教育等多个应用场景,提升文本检测的准确性与可靠性。

TryOffAnyone

TryOffAnyone是一款基于Latent Diffusion Models技术的AI工具,专注于从人物照片中提取服装区域并生成平铺展示图。它具备在线图片处理、智能服装识别、背景去除和图像优化等功能,广泛应用于电商平台的商品展示、个性化推荐、库存管理和图像检索等领域,帮助提升用户体验和运营效率。

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具,旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕,通过人类和自动评估方式,衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足,还推出了自动评估工具VideoCon-Physics,以推动模型性能的提升。其应用场景广泛,包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具,包含数据库(VE-Bench DB)和量化评估模块(VE-Bench QA)。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性,旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

braintrust

Braintrust 是一个端到端的 AI 工具平台,专注于通过迭代式的工作流帮助公司快速构建高效的 AI 应用。它提供了强大的提示调整、评分器配置及数据集管理功能,支持从模型评估到质量控制的全流程优化。此外,Braintrust 的直观界面和代码库集成特性使其适用于各类用户群体,广泛应用于 AI 产品开发、模型评估、质量控制及数据集构建等领域。

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台,专为评估和分析大型语言模型(LLMs)在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持,旨在为研究人员和开发者提供一个直观且高效的工具,用于测试和优化智能体在复杂交互环境中的表现。

SmartPrep.AI

SmartPrep.AI是一款基于AI的大模型教学辅助平台,专为教师和学生提供智能化解决方案。其核心功能涵盖智能课程计划生成、多源教学资源整合、可定制化评估工具等,支持多种教学方法并实现个性化定制。此外,它还适用于日常备课、跨学科项目设计、新教师培训以及远程教学等多种场景,显著提升教育工作的效率与效果。

Stocknear

Stocknear是一款利用AI技术的在线股票分析平台,提供股票评级、价格预测、市场情绪分析、财务数据展示及技术图表分析等功能。它能够帮助投资者深入了解股票市场动态,辅助其做出更明智的投资决策。Stocknear特别适合个人投资者、市场研究人员以及新手投资者使用,支持从基础学习到专业操作的多样化需求。 ---

ARCHITEChTURES

ARCHITEChTURES是一个基于AI的建筑设计平台,专注于自动化处理建筑设计中的重复性任务,如建模、测量和计算,以提高设计效率和质量。它支持多户型住宅建筑设计,提供CAD和BIM绘图功能,并具备测量、预算以及快速设计与共享能力。此外,平台还支持多种应用场景,包括可行性研究、场地规划、商业评估和概念迭代等。