训练

Magma

Magma是微软研究院开发的多模态AI基础模型,具备理解与执行多模态任务的能力,覆盖数字与物理环境。它融合语言、空间与时间智能,支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练,Magma在零样本和微调设置下表现优异,适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

秒画Sensemirage

商汤秒画Sensemirage是一款基于AI大模型的文生图创作平台,可以让用户通过输入文字描述,快速生成高质量的图像。

Loong

Loong是一种基于自回归大型语言模型的长视频生成工具,能够生成长达一分钟以上的高质量视频。其核心技术包括统一序列建模、渐进式训练方法及损失重新加权策略,确保生成视频在内容连贯性、动态丰富性和场景过渡上的卓越表现。Loong广泛适用于娱乐、教育、广告等多个领域,助力用户快速生成个性化、专业化的视频内容。

疯语咒AI

疯语咒AI是AI技术和教育的先行者,提供海量免费的AI学习材料。

wcplusPro

wcplusPro 是一款支持多平台的微信公众号数据采集与分析工具,可采集文章、阅读数据等信息,并支持百万级数据管理与快速检索。提供多种数据导出格式,适用于 AI 训练、内容分析、市场研究等场景。具备数据报告、全文搜索、任务管理等功能,满足不同用户的多样化需求。

天天跳绳

天天跳绳是一款基于AI技术的运动健身应用,通过手机摄像头捕捉用户动作,实现跳绳等运动的自动计数和监测。它提供个性化健身计划,包含多种运动项目和趣味游戏模式,支持在线互动与挑战,帮助用户高效完成健身目标。应用兼具实用性和娱乐性,适用于家庭、学校、办公室等多个场景。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

SynCamMaster

SynCamMaster是一款由多家顶尖高校与企业联合研发的多视角视频生成工具,支持从任意视点生成高质量开放世界视频。其核心技术包括结合6自由度相机姿态、多视图同步模块以及预训练文本到视频模型的增强版本。SynCamMaster不仅能在不同视角间保持动态同步,还能实现新视角下的视频合成与渲染,广泛应用于影视制作、游戏开发、虚拟现实及监控系统等领域。

CriticGPT

CriticGPT是一种基于GPT-4架构的人工智能模型,专注于审查和识别由大型语言模型生成的代码中的错误。它利用人类反馈强化学习(RLHF)技术,显著提高了代码审查的准确性和效率。CriticGPT具备代码审核、错误识别、安全漏洞分析、反馈生成、性能评估和辅助学习等功能。它通过记录人类评估员故意插入的错误,生成训练数据,并使用近端策略优化(PPO)算法和强制采样波束搜索(FSBS)技术,生成详细