生成 - 智狐AI导航

MimicPhoto

MimicPhoto 是一款基于 AI 的图像处理工具，支持面部表情优化、动态视频生成、背景替换及智能补光等功能。用户可轻松调整笑容、眼神等细节，将静态照片转化为生动的动态视频，提升人像质量和视觉表现力，适用于摄影、电商、社交媒体及创意制作等多种场景。

AI项目与工具 2025年06月12日 69 点赞 0 评论 645 浏览

VideoJAM

VideoJAM是Meta开发的视频生成框架，旨在提升视频运动连贯性。通过联合学习外观与运动信息，在训练阶段同时预测像素和运动特征，并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性，可适配多种视频生成模型，无需调整训练数据或模型结构，已在多项基准测试中表现优异，适用于影视、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 602 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 606 浏览

Onlook

Onlook 是一款开源的视觉编辑工具，专为 React 应用设计，支持设计师和开发人员在浏览器中实时修改 UI 并自动生成代码，提升协作效率。所有操作在本地完成，确保数据安全，兼容 React 和 TailwindCSS，未来将扩展至更多框架。适用于快速原型设计、设计与开发协作、设计系统维护等场景。

AI项目与工具 2025年06月12日 71 点赞 0 评论 731 浏览

Le Chat APP

Le Chat APP是一款由Mistral AI推出的AI对话工具，支持自然语言交互、实时搜索、文档分析与图像生成。提供免费基础版和付费Pro版，支持多语言及移动端使用，适用于学习、旅行规划、创意激发等多种场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 561 浏览

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架，能够实现唇部动作与音频信号的精准同步，并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑，基于130小时中文视频数据集训练，在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域，为视频内容创作提供了创新解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 491 浏览

Seede.ai

Seede.ai 是一款AI驱动的图像设计工具，支持通过文字描述或参考图片生成设计，提供智能压缩、背景移除、图像放大等免费图像处理功能，并结合AI辅助优化，帮助用户快速制作专业级设计作品，适用于社交媒体、广告、电商、艺术创作等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 837 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 725 浏览

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 638 浏览

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 572 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期