生成

LogoCreator

LogoCreator是一款基于AI技术的开源Logo生成工具,能够快速生成专业风格的Logo设计。它支持多种自定义风格选项,适用于初创企业、个人品牌、教育机构及非营利组织等场景。通过Next.js和TypeScript实现高效开发,同时借助Flux Pro 1.1引擎优化设计流程,确保生成的Logo兼具创意与实用性。

LOVO.AI

LOVO AI是一个功能强大的AI语音生成器,它通过提供多样化的语音选项和易用的编辑工具,帮助用户快速创建引人入胜的视频和音频内容。

CSM 3D Viewer

CSM 3D Viewer提供api、接口和开源软件,将多模态输入和体验转换为数字模拟器,用于人工智能训练和内容创建。我们相信,学习生成世界模型是实现AGI的系统路径,类似于儿童从经验中...

GameNGen

GameNGen是谷歌推出的一款AI游戏引擎,它能够以每秒20帧的速度实时生成高质量的DOOM游戏画面,使大多数玩家难以分辨真假。该工具无需编程,简化了开发流程,同时具备高逼真度和交互式体验,为游戏创作提供了新的可能性。除了游戏开发,它还能应用于虚拟现实、自动驾驶等多个领域,具有广泛的应用前景。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

RWKV

RWKV-7是一种先进的大模型架构,超越传统注意力机制,具备强大的上下文学习能力和高效的训练稳定性。其动态状态更新和学习率调整机制提升了模型性能,适用于文本生成、机器翻译、情感分析、对话系统及多语言处理等多种应用场景。

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具,支持多种音乐风格并提供高度自定义选项,如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐,并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景,是音乐爱好者和创作者的理想工具。

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍,由字节跳动的研究团队开发,只需添加一行代码即可

Sonauto

Sonauto是一个创新的在线音乐创作平台,它利用人工智能技术简化了音乐创作过程,使得没有专业音乐背景的用户也能创作出具有专业水准的音乐作品。

AI Picasso

AI Picasso 是一个可让您使用强大的 AI 创作令人惊叹的艺术品。它从您输入的文本中生成图像,类似Stable Diffusion。您还可以使用提示词进行编辑微调,享受使用 AI 进行艺术创作的乐趣。