生成

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

Text To Speech

构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

锐智AI

锐智AI是一款基于人工智能技术的学术辅助工具,支持论文大纲生成、内容撰写、文献引用、查重修改等功能,适用于课程论文、期刊论文、研究报告等多种场景。平台能根据用户输入的主题自动生成结构化内容,并提供语法修正、图表生成、素材库支持等增值服务,提升写作效率与质量。其智能化、多样化的功能满足不同用户的个性化需求,是学术写作的理想助手。

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具,支持多种音乐风格并提供高度自定义选项,如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐,并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景,是音乐爱好者和创作者的理想工具。

PictoGraphic:免费AI生成插图库

一个AI生成的插图库,提供超过40000张图像和SVG文件,你在这里可以找到适合自己的免费插图,同时你也可以在几秒钟内通过文本提示创建自定义插图。

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台,提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入,具备微信扩展、插件系统和支付接口,适用于企业及个人开发者构建智能应用。

3DFY

3DFY是一种人工智能驱动的 3D 生成工具,无需手动创建、输入文本、图像提示即可创建可扩展的高质量3D模型。