AI

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。

Kimi 创作空间

Kimi创作空间是一款利用AI技术辅助视频制作的工具,支持12种预设风格模板以及自定义素材上传,用户可通过输入场景描述和选择音乐快速生成音乐视频。其功能涵盖模板选择、自定义创作、场景描述输入、音乐添加、视频生成、编辑预览及下载,适用于社交媒体、商业宣传、个人娱乐等多种应用场景。

迅捷AI写作

一款AI智能写作工具,支持AI全文写作,根据指定关键词主题,可快速生成文章内容,可覆盖文案、报告、干货写作等多种实际场景。

Ai工具箱

10W AI作为一站式AI应用平台,汇集了AI聊天、图片处理、写作、AI游戏、音视频处理、学习教育、娱乐、营销、职场等10余个类别,数百个国内外主流AI工具。

FabricDiffusion

FabricDiffusion是一项由谷歌与卡内基梅隆大学联合开发的高保真3D服装生成技术,可将2D服装图像的纹理和印花高质量地转移到3D服装模型上。其核心技术基于去噪扩散模型和大规模合成数据集,生成多种纹理贴图并支持跨光照条件的精准渲染,具备优秀的泛化能力和实际应用潜力,适用于虚拟试衣、游戏开发、影视制作及时尚设计等多个领域。

Epsilla

Epsilla 是一个面向多行业用户的 AI 工具平台,支持通过领域专业知识定制 AI 代理,具备直观的界面和灵活的定制选项,内置检索增强生成(RAG)技术,简化了从概念到生产的 AI 应用部署流程。主要应用于内容生成、投资研究、法律案例分析、客户服务及教育等领域。

ViTPose

ViTPose 是一种基于 Transformer 架构的人体姿态估计模型,通过图像块处理和特征提取实现关键点定位。提供多种版本,适用于不同任务需求。模型结构简洁,支持灵活扩展和参数调整,具备知识迁移能力。ViTPose+ 拓展至动物姿态估计,提升适用范围。在多个数据集上达到 SOTA 性能,广泛应用于运动分析、虚拟现实等领域。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

Immersity AI

Immersity AI 是一款基于先进神经深度学习技术的AI平台,可将2D图像和视频转换为沉浸式3D视觉效果。它具备实时预览、编辑功能,并支持从静态图片到动态视频的全面转换,广泛应用于社交媒体、广告营销、教育、娱乐等领域,旨在提升用户体验与内容表现力。

Miracle F1

Miracle F1 是一款由美图 WHEE 推出的 AI 图像生成工具,具备高真实感的图像生成能力,能精准处理光影、材质和空间效果。其语义理解能力强,可准确还原复杂描述,如“纯色背景”“夜景灯光”等。支持多种风格,涵盖 3D 立体、二次元、复古等,适用于电商展示、活动海报、插画设计等多个场景。基于扩散模型和优化算法,提升了生成效率与质量。