训练

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架,通过嵌套UNet架构实现多分辨率联合去噪,支持从低分辨率到高分辨率的渐进式训练,显著提升高分辨率图像生成效率,适用于多种应用场景,如数字艺术创作、游戏开发、电影制作等,并具备出色的零样本泛化能力。

llama

这个存储库旨在作为一个最小...

VtripGPT

VtripGPT是一款专为旅游领域设计的AI大模型,采用Transformer架构,结合增量预训练和微调技术,可生成高质量的旅游相关文本回复。它具备对话生成、个性化旅游攻略提供、行程定制、商品推荐以及智能问答等功能,旨在提升旅游规划效率并优化用户体验。VtripGPT已成功应用于多个国家和地区,覆盖了从旅游攻略生成到商品推荐的多种应用场景。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具,适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气,通过视频和音频反馈练习非语言沟通技巧,并获得个性化反馈以提升表达能力。支持多语言使用,可无限重试,便于反复练习。具备嵌入功能,方便集成到其他平台。

HOVER

HOVER是一款由英伟达研发的1.5M参数量的小型模型,专注于人形机器人复杂动作的控制。其核心功能涵盖多模式控制、运动学位置跟踪、关节角度跟踪及统一命令空间设计,通过策略蒸馏与模拟训练实现高效技能迁移,广泛应用于导航、桌面操作、移动操作及远程操控等场景。

CriticGPT

CriticGPT是一种基于GPT-4架构的人工智能模型,专注于审查和识别由大型语言模型生成的代码中的错误。它利用人类反馈强化学习(RLHF)技术,显著提高了代码审查的准确性和效率。CriticGPT具备代码审核、错误识别、安全漏洞分析、反馈生成、性能评估和辅助学习等功能。它通过记录人类评估员故意插入的错误,生成训练数据,并使用近端策略优化(PPO)算法和强制采样波束搜索(FSBS)技术,生成详细

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型,兼具高性能与低成本优势,适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理,可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域,具备良好的扩展性和系统集成能力。

Photo AI

Photo AI 是一种革命性的人工智能工具,使用ai为您提供专业水准的照片拍摄,用于在各种设置中生成逼真的图像。