生成

Amphion

Amphion是一款开源音频生成工具包,包含文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)和文本转音乐(TTM)等功能。它支持多种神经声码器,并提供可视化模型架构,帮助用户快速掌握音频生成技术。通过统一框架和预训练模型,Amphion推动了音频生成领域的研究和应用发展。

FLUX

FLUX-Controlnet-Inpainting是一款基于ControlNet和FLUX.1-dev技术的图像修复工具,能够通过用户指定的掩码区域对图像进行精准修复。其主要特点包括风格一致性、边缘和结构保持、高质量生成以及参数可调性。工具广泛应用于历史照片修复、艺术创作、媒体娱乐、广告营销、数据增强及医学成像等领域。

灵码 IDE

灵码 IDE是通义推出的AI原生IDE,深度适配千问3大模型,集成编程智能体、行间建议预测、行间会话等功能。支持多种编程语言和主流IDE,具备代码生成、续写、注释、单元测试生成、异常排查等能力,可提升开发效率。开发者可通过自然语言描述任务,实现端到端的编码操作,适用于新功能开发、工程级任务及企业数据个性化场景。

Chillin

Chillin是一款AI驱动的在线视频编辑工具,融合了After Effects和Premiere Pro的功能,支持无缝视频编辑与矢量动画制作。它具备AI字幕生成、图像背景去除、高质量图像生成等功能,支持跨平台使用且无水印限制,适用于多种应用场景如社交媒体、在线教育、企业宣传和个人创作。

GlatoAI

只需一个简单的网页链接,GlatoAI将你的产品,网页,文章转变为令人瞩目的短视频,不仅融入栩栩如生的虚拟人物讲解,还配备专业的语音配音与精准字幕。

Pixela AI

Pixela.ai 是一个 AI 生成的游戏纹理素材库,也是一个社区,您可以在其中分享自己的创作并查看其他人的作品。

大拍档剪辑助手

由B站UP主视频大拍档设计和开发的整合了视频剪辑中非常实用的功能于一身的桌面程序。

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。

FashionLabs

FashionLabs,AI服装模特商拍,为商家和品牌打造独特的AI商品图片,提供高品质的AI服装模特,为用户展现服装的魅力,提升品牌形象和销售。

PulpMiner

一款将网页数据实时转化为JSON API的工具,用户粘贴网页 URL 并指定 JSON 结构,AI 自动提取数据并格式化。