生成 - 智狐AI导航

ImageToPromptAI

ImageToPromptAI 是一款AI驱动的图像转文本工具，可快速生成高精度的图像描述，适用于图像生成、艺术创作及内容设计等领域。其功能包括图像分析、文本提示生成和隐私保护，支持多场景应用，助力创作者提高效率与创意表现。

AI项目与工具 2025年06月12日 16 点赞 0 评论 761 浏览

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具，通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略，确保编辑内容自然融合，保留原始细节。支持真实图像和多部分同时编辑，无需重新训练模型，适用于艺术设计、影视制作、广告等多个领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 572 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 834 浏览

播记

播记是一款基于AI技术的播客节目笔记生成工具，能够自动提取音频内容中的关键信息，生成包含主题、嘉宾介绍、观点及时间戳的详细笔记。支持多种格式导出，便于内容管理和二次创作。适用于社交媒体、邮件简报、博客文章等多种场景，具备智能分类、多语言支持及内容优化功能，提升播客内容的传播效率与质量。

AI项目与工具 2025年06月12日 48 点赞 0 评论 514 浏览

Pikadditions

Pikadditions是Pika推出的一项AI视频编辑工具，支持将图片无缝融入视频中，生成自然且引人入胜的效果。用户只需上传视频和图片，并输入简短提示，即可完成合成。功能操作简便，适用于创意视频制作、教育、影视、个人娱乐及企业宣传等多个领域，有效降低视频制作门槛和成本。

AI项目与工具 2025年06月12日 84 点赞 0 评论 541 浏览

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 572 浏览

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 638 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 725 浏览

Seede.ai

Seede.ai 是一款AI驱动的图像设计工具，支持通过文字描述或参考图片生成设计，提供智能压缩、背景移除、图像放大等免费图像处理功能，并结合AI辅助优化，帮助用户快速制作专业级设计作品，适用于社交媒体、广告、电商、艺术创作等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 837 浏览

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架，能够实现唇部动作与音频信号的精准同步，并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑，基于130小时中文视频数据集训练，在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域，为视频内容创作提供了创新解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 491 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期