AI

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集,用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像,结合共享注意力机制和3D资产引导,确保对象一致性。该数据集支持无调优模型训练,提升图像质量和身份保持能力,广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

VideoJAM

VideoJAM是Meta开发的视频生成框架,旨在提升视频运动连贯性。通过联合学习外观与运动信息,在训练阶段同时预测像素和运动特征,并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性,可适配多种视频生成模型,无需调整训练数据或模型结构,已在多项基准测试中表现优异,适用于影视、游戏、教育等多个领域。

Melodisco

Melodisco 作为一个 AI 音乐播放器,为音乐爱好者提供了一个新颖的平台,让他们能够探索由 AI 创作的音乐世界。

Eagle

Eagle是一个由英伟达开发的多模态大模型,专长于处理高分辨率图像,提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构,通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源,适用于多个行业,具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

Image to Music

Image to Music 是一款基于AI的图像转音乐工具,通过分析图像的颜色、形状和纹理等元素,生成多种风格的音乐。用户可直接上传图片并选择模型,快速获得钢琴、吉他、管弦乐等音乐作品。无需注册,无使用限制,适用于音乐创作、广告营销、教育及个性化礼物制作等多种场景,为艺术创作提供新思路。

Leap AI

Leap AI通过其自动化工具,帮助营销团队更高效地将视频内容转化为文本内容,提升内容营销的覆盖面和效果。

Tempo Labs

Tempo Labs是一款基于AI技术的开发平台,专注于助力设计师和开发者高效构建React应用。它提供拖放式编辑器、组件管理、代码优化及GitHub集成等功能,支持灵活的本地编辑与团队协作,帮助企业加速产品开发并保持设计一致性。

气泡岛

气泡岛,遇见AI伙伴,开启个性化智能对话,体验多元互动乐趣

CustomVideoX

CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架,能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差(TAB)和实体区域感知增强(ERAE),有效提升视频的时间连贯性和语义一致性。支持多种应用场景,如艺术设计、广告营销、影视制作等,具备高效、精准和可扩展的特点。

造梦日记Ai

造梦日记Ai,凭借在AI领域多年的深耕以及西湖大学实验室的成熟算力,用户输入一些关键词或者一段描述某场景的文字,便可在几秒内生成一张独创的、版权归属于自己的图片。