创作

Mubert

人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

LongAlign

LongAlign是一种针对文本到图像生成任务的改进方法,通过分段级编码技术和分解偏好优化,有效解决了长文本输入的对齐问题。它能够显著提升生成图像与输入文本的一致性,广泛应用于艺术创作、游戏开发、影视制作及教育等领域,具备高精度和强泛化能力。

TeleAI 视频生成大模型

TeleAI视频生成大模型是一款基于两阶段生成框架的AI工具,能够根据文本描述生成高质量视频,具备主体外观一致性、动作控制精准性以及场景过渡流畅性等特点。它广泛应用于影视制作、广告行业、教育培训、游戏开发及新闻报道等领域,助力提升创作效率并降低成本。

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具,能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡,支持零样本学习和多轮编辑操作,确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域,提供从简单调整到复杂创意的全面解决方案。

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型,可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构,结合ControlMLP模块与注意力偏差技术,实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全,适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程,确保生成质量与稳定性。

Hedra

Hedra是由一批前斯坦福大学研究员组成的数字创新实验室推出的一款人工智能驱动的视频创作工具。它致力于将先进的AI技术运用到角色视频的创造过程中。用户只需提供一张照片和一段音...

Airbrush AI

仅需1次点击即可生成由人工智能提供支持的图像。Airbrush的人工智能技术,让您可以在短短几秒钟内创建原创的库存照片、NFT、艺术作品等。

魔多AI

一个专为AI创作者打造的趣玩社区,提供多种AI模型和创作工具,支持用户进行插画、动漫、写实等多种风格的图像创作。