生成

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具,结合3D人体重建与扩散模型技术,支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力,适用于游戏、影视、体育及时尚等领域,具备高保真度与真实感。

BlipCut

BlipCut是一款基于AI的视频处理工具,支持130多种语言的视频翻译、自动字幕生成、AI配音和唇形同步。用户可上传视频或链接,一键生成多语言版本,并支持语音克隆、智能剪辑及批量处理,适用于内容创作、教育、营销等场景。

SpeechEasy

SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单...

HivisionIDPhotos

HivisionIDPhotos 是一款基于人工智能技术的证件照制作工具,支持智能抠图、多尺寸证件照生成等功能。该工具还计划在未来版本中增加智能换正装和美颜功能。它支持 Docker 部署,并提供 API 接口以便开发者集成和自动化证件照生成流程。适用于个人、企业人力资源、教育机构、在线服务提供商及摄影工作室等多种应用场景。

Objaverse-3D物体数据集

Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

Openart

Openart是一个在线AI绘画艺术图片生成器工具,让用户可以利用人工智能(AI)来创造和编辑图像。无论用户是艺术家、设计师、作家、游戏开发者还是市场营销人员,都可以在Openart上...

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

misgif

misgif是一款基于AI的创意工具,通过面部替换技术将用户照片融入热门GIF、影视片段中,生成个性化表情包和视频。它支持多平台操作,拥有丰富的媒体库和强大的编辑功能,适合个人娱乐、社交媒体内容创作及品牌营销推广,同时提升群聊互动趣味性。

Raphael AI

一款基于 ​​FLUX.1-Dev 模型​​ 的免费 AI 图像生成工具,主打 ​​无需注册、无限生成、隐私保护​​ 等特点,适合个人创作者和企业使用。