生成

PhotoGrid

一款免费的在线拼图制作器与照片编辑器,支持裁剪、调整参数、添加贴纸文字等基础编辑,以及AI 去背景、生成内容、替换物体、75 + 创意 AI 滤镜等AI功能。

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型,支持 20 种印度语言和英语,提供 69 种独特语音。该模型基于深度学习架构,通过描述性文本输入实现对音调、语速、情感等参数的灵活控制,适用于多种语音合成场景。在低资源语言上表现优异,具备高自然度和清晰度的语音输出能力。

CreatiLayout

CreatiLayout 是一种先进的布局到图像生成技术,由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM,结合 SiamLayout 框架和 MM-DiT 架构,实现高质量、细粒度可控的图像生成。同时,其 LayoutDesigner 工具支持多种输入方式,帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。

Resona V2A

专注于将视频内容自动转化为高质量音频。Resona V2A通过分析视频中的视觉元素,Resona V2A 能够生成与视频内容相匹配的声音设计、音效和环境音。

Maket AI

一款由 AI 驱动的建筑住宅设计软件,能让建筑师、建筑商和开发人员能够立即快速生成数千个建筑住宅设计方案。

MCA

MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架,通过引入SAGI和SALQ注意力控制策略及主体定位模块,提升图像生成质量与一致性。支持零样本图像生成,适用于主体特征保持、背景一致性维护等多种任务,广泛应用于数字内容创作、广告设计、艺术创作等领域。

AI2image

AI2image 是一个基于AI技术,通过将您的文字转换为符合您的风格和偏好的图像。您可以使用它为您的网站、博客、社交媒体或其他目的。

D-ID

D-ID是一个利用生成式AI技术的平台,专注于为专业人士和内容创作者提供视频内容的创新解决方案。它允许用户从文本生成逼真的数字人物,从而简化大规模视频制作的流程。

2short.Ai

一款人工智能驱动的应用程序,可帮助YouTube 制作人将他们的长视频材料转换为youtube短视频。

EDTalk

EDTalk是一款基于音频驱动的唇部同步模型,支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频,广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。