生成

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型,通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术,实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展,并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

Epsilla

Epsilla 是一个面向多行业用户的 AI 工具平台,支持通过领域专业知识定制 AI 代理,具备直观的界面和灵活的定制选项,内置检索增强生成(RAG)技术,简化了从概念到生产的 AI 应用部署流程。主要应用于内容生成、投资研究、法律案例分析、客户服务及教育等领域。

AnimeAI

一款功能强大的动漫图片生成器AI 工具,用户通过上传人像照片创建具有多种风格的自定义动漫图片。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段,生成高度可控且逼真的动画,保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异,适用于虚拟现实、游戏、人机交互等多个领域。

Readdy

Readdy 是一款基于AI的设计工具,支持自然语言输入生成Figma级设计稿并导出React/Vue等前端代码,提升设计与开发效率。适合非专业用户、开发者及团队使用,提供多版本订阅方案,支持快速原型设计与电商页面开发,具备高可用性代码生成能力。

TPDM

TPDM是一种基于扩散模型的图像生成技术,通过引入时间预测模块(TPM)和强化学习优化策略,实现了对去噪步骤的自适应调整,从而在保证图像质量的同时提高了生成效率。该模型适用于多种应用场景,包括文本到图像生成、艺术创作辅助以及数字媒体内容生产等,广泛应用于广告、游戏设计、影视制作等领域。

Withpoly

一个免费的 AI 驱动的根据文本生成3D材质纹理的生成器。

Animaker

Animaker是一款结合人工智能技术的在线视频与动画制作平台,支持从创意构思到成品输出的全流程操作。它提供了丰富的模板、角色定制工具、庞大的媒体资源库,并具备自动口型同步、多语言配音等功能,适用于教育、营销、企业沟通、个人项目等多个领域。无论是复杂特效还是基础编辑,Animaker都能满足不同用户的多样化需求。