图像

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具,支持七种核心图像编辑任务,包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像,采用EditNet架构,提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异,适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

HyperBooth.Ai

人工智能个性化照片写真生成器。只需上传一张输入照片,HyperBooth.Ai即可在 30 秒或更短的时间内生成您喜欢的风格的 AI照片。

OThink

OThink-MR1是由OPPO研究院与香港科技大学(广州)联合研发的多模态语言模型优化框架,基于动态KL散度策略(GRPO-D)和奖励模型,提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制,适用于智能视觉问答、图像描述生成、内容审核等多个领域,具有广阔的应用前景。

联通元景

联通元景(UniT2IXL)是一款基于国产昇腾AI平台开发的中文原生文生图模型,具备卓越的中文语义理解和高质量图像生成能力。它通过复合语言编码模块优化中文长文本处理,并利用大量中文图文数据进行预训练,确保信息完整性和生成质量。该模型支持国产化算力环境,适配多种应用场景,包括文物数字化、个性化服装定制、智能家居设计、广告创意生成及在线教育等,为企业提供高效解决方案。

酷雀AI智能抠图

酷雀AI智能抠图是一款基于先进AI技术的图片处理工具,能够快速精准地识别并去除图片背景,支持人像、物品及复杂场景的精细化抠图,保留细节如发丝。具备证件照制作、模糊图片优化、无损放大、图片尺寸调整等功能,操作简单,无需专业技能,满足日常多种图片处理需求。

Picarta

Picarta是一款基于AI技术的图像位置识别工具,可自动分析照片并提供地理信息,支持旅行照片整理、摄影管理、新闻验证和历史研究等功能。平台注重隐私保护,提供多样化的服务模式,满足个人和企业用户的需求。

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型,参数量为968M。它基于LLaVA架构优化,能够处理视觉与文本输入,显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能,广泛应用于内容审核、智能助手、视觉搜索等领域。

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器,支持自回归图像生成,具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略,实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用,具有广泛的技术拓展性。

NSFW Detector

NSFW Detector是一款基于深度学习的开源工具,利用Google的`vit-base-patch16-224-in21k`模型,能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署,具备多CPU加速特性,可实现快速且安全的本地化内容分类,广泛应用于社交媒体、内容共享平台、企业网络等多个领域。

MiniMax MCP Server

MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器,支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力,兼容多种主流客户端。平台采用客户端-服务器架构,结合 RAG 技术提升响应准确性,适用于教学、游戏开发、内容创作等多个领域。