图像

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型,能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成,并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制,确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。

EasyOCR

EasyOCR是一款基于深度学习技术的开源OCR工具,支持超过80种语言及多种书写系统。它提供高精度的文字识别能力,用户可通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用,支持跨平台操作,并具备批量处理能力。该工具在图像质量有一定要求的情况下,能够高效处理大量图像文件。

Artimator.Io

一个免费的 AI 驱动的艺术生成器,可让您从文本描述或照片中创建独特的艺术品。它利用 Stable Diffusion 和 SDXL 人工智能,提供了一个多功能平台,用于生成各种风格的艺术作品。

Magnific AI

Magnific AI,一个基于生成式AI的图像超分辨率增强工具,不仅可以实现图片的分辨率提升,更可以依靠自然语言提示和“创意”滑块等控制参数,让AI主动增加和“猜想”更多细节信息。

Almaginate-增强版MJ

Almaginate作为一个AI创作平台,通过提供图像生成、风格转换和创意启发等功能,帮助用户以新颖的方式进行艺术创作。它可能特别适合那些寻求创新创作方法的艺术家和设计师。

改图鸭

改图鸭是一个在线图片处理工具,用户无需下载、安装任何程序,即可在线对图片进行多种编辑处理。它拥有多功能图片处理功能,如图片编辑、图片格式转换、证件照制作、图片变漫画、...

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具,通过物理渲染引擎生成合成数据并结合多任务训练策略,实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像,生成自然的高光、阴影和漫反射效果,并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域,具备良好的泛化能力和实用性。