图像

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型,擅长处理文本、图像等多模态数据,具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色,但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

AI Ease

AI Ease是一款基于人工智能的在线照片编辑工具,提供背景移除、水印消除、图像生成、艺术风格转换、肖像美化等多种功能。支持移动设备使用,操作简便,适用于电商、社交媒体、个人美化及创意设计等场景。提供免费与专业订阅方案,保障用户数据安全。

SwiftChat

一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。

Bria.ai

一个使用AI 大规模创建和自定义图像和视频的平台。无论您是需要删除不需要的对象、找到完美的图像、修改现有图像还是文字创建独特的背景。

Wear

Wear-Any-Way是阿里巴巴拍立淘团队研发的虚拟试穿框架,通过稀疏对应对齐机制实现高保真、可定制的试穿效果。用户可自由调整服装样式、颜色及搭配方式,适用于多种场景。具备多件服装搭配、多场景支持及智能推荐功能,适用于电商、时尚设计等领域,提升用户体验与效率。

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术,能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化,结合动态权重平衡和多种损失函数,提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能,适用于室内场景、艺术风格转换及跨视图一致性任务。

Pixelfox

Pixelfox 是一款基于AI技术的在线图片编辑工具,支持背景移除、AI换脸、图像修复、图片放大等多种功能。用户无需下载软件,直接在浏览器中上传图片即可快速完成编辑。操作简单、处理高效,适用于摄影、电商、社交媒体等多个领域,适合各类图像处理需求。

MIP

MIP-Adapter是一种基于IP-Adapter模型开发的个性化图像生成技术,能够高效处理多参考图像并生成高质量的定制化图像。通过解耦交叉注意力机制和加权合并方法,解决了多图像输入中的对象混淆问题,提升了生成图像的质量。该技术无需测试时微调,具有高效训练的特点,广泛应用于社交媒体、广告、游戏设计等多个领域。

Hayo

在 Hayo 可以找到满足你需求的各种 AI 工具并且可以直接尝试使用。

TextIn

TextIn是一款利用OCR技术实现文字识别的AI平台,支持多语言且具备强大的图像处理能力。它可以从各种类型的文档中提取结构化信息,并提供灵活的部署选项,适用于金融、物流、制造业等多个领域。TextIn通过智能算法优化文档处理流程,帮助企业提升效率。