生成 - 智狐AI导航

SnapGen

SnapGen是一款由Snap Inc、香港科技大学和墨尔本大学联合开发的文本到图像扩散模型，专为移动设备设计，支持在1.4秒内生成1024×1024像素的高分辨率图像。它通过优化网络架构、跨架构知识蒸馏和对抗性训练等技术，在保持小模型规模的同时，提供了高质量的图像生成能力，适用于社交媒体、移动应用、教育、新闻等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 642 浏览

Paperpal

Paperpal是一款专为学术写作设计的AI工具，提供语言编辑、文本改写、投稿检查、抄袭检测、学术翻译等多功能服务。通过整合先进的AI技术，Paperpal能够实时提供符合学术规范的语言建议，并支持多种语言翻译与文献引用生成，助力用户高效完成科研任务。其适用范围覆盖学术写作全流程，特别适合全球范围内从事科学研究的专业人士。

AI项目与工具 2025年06月12日 90 点赞 0 评论 597 浏览

Veo 2

Veo 2 是一款由 Google DeepMind 开发的 AI 视频生成工具，支持高达 4K 分辨率，可生成高质量视频并模拟物理现象及人类表情。它具备修复、外扩、插值等功能，广泛应用于电影制作、虚拟旅游、教育视频等领域，具有高精度和安全性。

AI项目与工具 2025年06月12日 85 点赞 0 评论 832 浏览

Whisk

Whisk是一款基于AI的图像生成工具，由谷歌推出，支持用户通过上传图像并指定主题、场景和风格生成新图像。它具备多图像输入、自动图像提示及额外文字细节添加等功能，基于谷歌最新的Imagen 3模型，适用于艺术创作、广告营销、社交媒体内容生产等多个领域，助力用户高效完成创意设计。

AI项目与工具 2025年06月12日 31 点赞 0 评论 791 浏览

Rap Generator

Rap Generator是一款结合AI技术的在线音乐生成工具，支持用户通过自定义输入或AI生成歌词来创作个性化说唱歌曲。它提供了多种音乐风格供选择，并具备配乐、标题生成等实用功能，同时支持隐私保护与音乐下载。无论是专业音乐制作人还是初学者，均可利用其灵活的功能模块实现创意表达。

AI项目与工具 2025年06月12日 70 点赞 0 评论 756 浏览

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具，支持超过30种性别和语言的声音选择，用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件，适用于产品演示、教育培训、营销推广等多种场景，助力高效生成高质量语音内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 634 浏览

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型，支持多分辨率和多时长的视频生成，具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成，旨在降低动漫和游戏内容的开发周期和成本。目前，Ruyi-Mini-7B版本已开源。

AI项目与工具 2025年06月12日 17 点赞 0 评论 529 浏览

潮际主设

潮际主设是一款基于AI技术的时尚设计工具，专为服装设计师提供支持。它涵盖款式生成、局部优化、图案设计和颜色替换等功能，通过智能化操作提升设计效率，并支持个性化定制与快速原型制作，适用于服装设计、趋势预测及颜色搭配等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 598 浏览

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架，通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性，能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域，展现出卓越的性能与灵活性。

AI项目与工具 2025年06月12日 18 点赞 0 评论 633 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 807 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期