训练 - 智狐AI导航

Transfusion

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 591 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 590 浏览

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 588 浏览

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 584 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 584 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 583 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 582 浏览

VtripGPT

VtripGPT是一款专为旅游领域设计的AI大模型，采用Transformer架构，结合增量预训练和微调技术，可生成高质量的旅游相关文本回复。它具备对话生成、个性化旅游攻略提供、行程定制、商品推荐以及智能问答等功能，旨在提升旅游规划效率并优化用户体验。VtripGPT已成功应用于多个国家和地区，覆盖了从旅游攻略生成到商品推荐的多种应用场景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 582 浏览

秒画Sensemirage

商汤秒画Sensemirage是一款基于AI大模型的文生图创作平台，可以让用户通过输入文字描述，快速生成高质量的图像。

Ai绘画生成 2025年06月05日 72 点赞 0 评论 582 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 581 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期