Transformer

InstantStyle

InstantStyle是由InstantX团队开发的一项AI技术，它能够根据用户提供的单张参考图，将任何图片渲染成该风格。无论是古典油画的细腻笔触，还是现代抽象艺术的大胆色彩，InstantStyl...

Ai绘画生成 2026年06月21日 0 点赞 0 评论 345 浏览

Snap Video

强大的文本到视频合成工具，它通过创新的技术架构和高效的深度学习模型，实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性，还为用户提供了一种全新的创作和表...

Ai平台模型 2026年06月21日 0 点赞 0 评论 350 浏览

八斗智能

八斗智能的语义理解模型是一个强大的工具，它通过大规模预训练和行业特定的迁移学习，能够提供高度准确的语义理解服务。

Ai平台模型 2026年06月21日 0 点赞 0 评论 362 浏览

V

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

Ai平台模型 2026年06月21日 0 点赞 0 评论 363 浏览

DiT

创新的图像生成模型，它通过结合扩散模型和Transformer架构，实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。

Ai平台模型 2026年06月21日 0 点赞 0 评论 370 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 473 浏览

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系，并使用 Transformer 语言模型构建播放列表。由于没有更好的术语，音乐推荐是一种“闭门造车”的东西。

创作工具 2026年06月21日 0 点赞 0 评论 484 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 488 浏览

Hunyuan3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型，支持文本和图像输入生成高质量3D资产。该模型采用两阶段方法，包含轻量版和标准版，具有快速生成和高质量重建的特点，广泛应用于3D创作、工业设计、建筑设计等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 496 浏览

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

Ai平台模型 2026年06月21日 0 点赞 0 评论 500 浏览

Transformer

首页

Transformer

列表

默认

浏览次数

发布日期