AI图像

LBM

LBM(Latent Bridge Matching)是一种基于潜在空间桥接匹配的图像到图像转换框架,支持目标移除、图像重光照、深度图生成等多种任务。通过布朗桥和随机微分方程实现高效且多样化的图像转换,具备良好的可控性和视觉一致性。适用于摄影、设计、3D建模等多个领域,具有广泛的应用前景。

Kive

Kive是一个基于AI技术的创意内容生成平台,帮助品牌和创作者快速生成、管理和扩展符合品牌形象的视觉内容。用户通过文字描述即可生成高质量的图片和视频,支持将真实产品图片融入AI生成场景中,提升视觉吸引力。平台提供创意资产管理功能,自动分类和索引视觉资产,提升工作效率。Kive适用于社交媒体内容创作、广告制作、品牌推广、创意设计和产品展示等多种场景。

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具,能够将照片转换为各种艺术风格,如古典绘画或现代数字艺术,同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像,支持无缝合并多张照片,生成集体照或新场景,并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案,适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

Sana

SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架,支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器(Linear DiT)和小型语言模型作为文本编码器,并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势,适合多种应用场景,包括艺术创作、游戏开发、广告设计和科学研究等。

ICEdit

ICEdit是由浙江大学与哈佛大学联合开发的指令式图像编辑框架,基于扩散变换器实现自然语言驱动的图像修改。支持多轮编辑、风格转换、对象替换等功能,具有高效处理能力(单张图像约9秒)。采用LoRA-MoE混合微调策略,降低资源需求,适用于创意设计、影视制作、社交媒体等多个领域。开源且提供在线体验,便于研究与应用。

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型,能够根据文本描述精准生成高质量、高分辨率图像,支持多种纵横比输出。具备优秀的人物与物体渲染能力,适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成,单次最多输出 9 张图像,每分钟处理 10 个请求,提升创作效率。采用扩散模型与 Transformer 架构,结合线性注意力与 MoE 技术,确保图像质量与生成效率。

CogView4

CogView4是一款由智谱推出的开源文生图模型,具有60亿参数,支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异,达到当前开源模型的领先水平。模型具备强大的语义理解能力,尤其在中文文字生成方面表现突出,适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer,并采用显存优化技术提升推理效率。

Genius

Genius是一款基于AI技术的照片编辑工具,支持艺术风格转换、背景扩展、图像质量提升及AI艺术生成等功能。用户可通过简单操作将普通图片转化为多种艺术形式,适用于社交媒体、摄影后期、数字艺术及商业营销等多个场景,提高创作效率与视觉表现力。

洞图

洞图是一款集多功能于一体的AI图片处理工具,主要功能包括制作隐藏文字的幻觉图片、生成逼真的AI写真、智能擦除路人、照片动态化、AI换脸、美肤优化、风格滤镜应用以及照片清晰度提升等。其简洁的操作界面和强大处理能力,使用户能快速生成个性化图文素材,适用于多种应用场景,如社交媒体分享、隐私保护、形象照制作及照片修复等。