图像

Colormind

Colormind 是一款基于 AI 技术的颜色方案生成工具,能够根据图片或数据集自动生成协调的配色方案。用户可自定义颜色并探索不同风格,适用于平面设计、影视、游戏开发、时尚创作等多个领域。该工具支持 API 接口,便于集成到各类项目中,是设计师和创意工作者的理想助手。

Object Cutter

Object Cutter是一款基于AI的智能图像处理工具,支持文字指令和框选操作,实现高精度图像分割。它能够自动识别并抠出图像中的特定对象,尤其擅长处理复杂背景和细节丰富的图像。其主要功能包括智能抠图、背景移除和高精度图像分割,广泛应用于电商展示、设计创作、影视后期及个人照片编辑等领域。

Foxify.Art

一个专门根据用户输入文本提示使用AI技术生成动漫图像的网站。用户可以输入文本提示,Foxify 会根据该提示生成图像。

YesChat Ai

一个提供由Claude 2提供动力的聊天机器人服务的网站。用户可以与YesChat Ai聊天机器人进行免费且无限制的对话。

Wear

Wear-Any-Way是阿里巴巴拍立淘团队研发的虚拟试穿框架,通过稀疏对应对齐机制实现高保真、可定制的试穿效果。用户可自由调整服装样式、颜色及搭配方式,适用于多种场景。具备多件服装搭配、多场景支持及智能推荐功能,适用于电商、时尚设计等领域,提升用户体验与效率。

MUMU

MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像来生成目标图像,提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet,并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力,同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

Transmonkey AI

一款由AI驱动的翻译软件,支持超过 130 种语言,包括英语、中文、日语、阿拉伯语、法语、德语、希伯来语、印尼语等,并能处理文档、视频、图片和音频等各种文件格式。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具,通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略,确保编辑内容自然融合,保留原始细节。支持真实图像和多部分同时编辑,无需重新训练模型,适用于艺术设计、影视制作、广告等多个领域。

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术,能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化,结合动态权重平衡和多种损失函数,提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能,适用于室内场景、艺术风格转换及跨视图一致性任务。