训练 - 智狐AI导航

触手AI绘画-4090极速出图

可以免费使用的AI绘画工具！

Ai绘画生成 1970年01月01日 0 点赞 0 评论 524 浏览

SpatialVLA

SpatialVLA是一款由多机构联合研发的空间具身通用操作模型，具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术，实现精准的环境感知与动作生成。支持零样本任务执行与快速微调，适用于工业、物流、医疗等多个领域，推动机器人技术的发展与应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 523 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 520 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 520 浏览

FaceChain

FaceChain是一个由阿里巴巴达摩院开发的开源AI生成框架，专为创建个人数字形象而设计。用户上传个人照片后，可生成独特且个性化的数字写真。该框架采用先进的机器学习技术，支持多风格写真生成、个性化训练、姿态控制和自定义提示词等功能，满足不同用户的多样化需求。

AI项目与工具 2024年01月01日 50 点赞 0 评论 520 浏览

HOVER

HOVER是一款由英伟达研发的1.5M参数量的小型模型，专注于人形机器人复杂动作的控制。其核心功能涵盖多模式控制、运动学位置跟踪、关节角度跟踪及统一命令空间设计，通过策略蒸馏与模拟训练实现高效技能迁移，广泛应用于导航、桌面操作、移动操作及远程操控等场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 519 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 516 浏览

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 515 浏览

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 515 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 514 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期