图像

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型,主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作,包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作,实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性,能够展示原始主体的不同动作和表情。此外,VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架,支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计,能够快速生成高质量图像并提升推理效率。

Krea AI

Krea AI是一款由AI驱动的AI创意工具,可以生成图像和视频,设计工具,满足创意需求。

Colorize Photos

一个基于AI的在线智能转换工具。使用AI为照片着色,在几秒钟内将黑白图片转换为彩色。

Jaaz

Jaaz是一款开源的AI设计Agent,提供本地免费的AI设计服务。它能智能生成设计提示,批量生成图像、海报和故事板,并支持Ollama、Stable Diffusion等本地图像和语言模型。用户可通过GPT-4o、Flux Kontext等技术在对话中编辑图像,进行对象移除和风格转换。Jaaz提供无限创意画布,适用于创意设计、快速原型、教育及个人创作等多种场景。

ArtSmart AI

一款利用AI训练的艺术和写实模型生成独特惊艳的图像的AI图像生成器。它能够将想象力变成现实,帮助用户将他们的想法变成美丽的艺术品。

Pixtral Large

Pixtral Large是一款由Mistral AI开源的超大规模多模态模型,具备1240亿参数,支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口,能在多语言环境中处理复杂文档和多图像场景,广泛应用于教育、医疗、客服和内容审核等领域。

Webdraw

Webdraw 是一款无代码 AI 应用开发平台,支持图像生成、视频制作、聊天助手等功能,用户可通过自然语言或可视化工具快速构建应用。平台集成多种 AI 模型,支持多模态内容创作,具备文件共享、实时协作和一键部署能力,适用于创意设计、个性化工具开发、教育及企业场景,降低 AI 技术使用门槛。

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具,可根据文本生成Live2D格式的2D卡通角色,具备文本解析、外观生成、动画增强等功能。支持多语言输入,适用于游戏、影视、教育等多个场景,提升角色设计效率与表现力。

Go Charlie

一款AI营销助手,帮助企业家和企业快速轻松地创建和发布内容,Go Charlie可帮助您在几秒钟内创建图像、博客、广告、影响者帖子等。