训练 - 智狐AI导航

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 584 浏览

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 588 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 590 浏览

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 591 浏览

疯语咒AI

疯语咒AI是AI技术和教育的先行者，提供海量免费的AI学习材料。

Ai学习资源 2025年06月05日 21 点赞 0 评论 593 浏览

DRT

DRT-o1是一套由腾讯研究院开发的基于长链思考推理（CoT）技术的AI翻译模型，专门针对文学作品翻译设计，尤其擅长处理比喻和隐喻等复杂修辞手法。模型通过多智能体框架和迭代优化机制，显著提升了翻译质量和效率，同时具备强大的复杂语言结构处理能力。DRT-o1已在多个应用场景中展现出广泛潜力，包括文学翻译、跨文化交流、教育辅助以及多语言内容创作等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 594 浏览

触手AI绘画-4090极速出图

可以免费使用的AI绘画工具！

Ai绘画生成 2026年06月21日 0 点赞 0 评论 594 浏览

芝士饼

一款支持一站式AI原生应用的开发平台，芝士饼无需任何代码基础，只需通过自然语言，简单几步即可完成应用的创建与发布。

Ai平台模型 2025年06月05日 34 点赞 0 评论 595 浏览

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 596 浏览

CriticGPT

CriticGPT是一种基于GPT-4架构的人工智能模型，专注于审查和识别由大型语言模型生成的代码中的错误。它利用人类反馈强化学习（RLHF）技术，显著提高了代码审查的准确性和效率。CriticGPT具备代码审核、错误识别、安全漏洞分析、反馈生成、性能评估和辅助学习等功能。它通过记录人类评估员故意插入的错误，生成训练数据，并使用近端策略优化（PPO）算法和强制采样波束搜索（FSBS）技术，生成详细

AI项目与工具 2025年06月12日 76 点赞 0 评论 597 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期