图像处理

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型,基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入,可生成结构化文本输出,并具备音频转录、情感分析等功能。可在本地设备运行,响应时间低至 50 毫秒,适用于语音助手、内容生成和学术任务定制。

FlexTok

FlexTok 是由EPFL与苹果联合开发的图像处理技术,通过将图像转为离散标记序列实现高效压缩与生成。支持8K视频实时渲染,压缩率提升300%,功耗降低45%。具备无损超分辨率重建和灵活图像生成能力,适用于智能家居、安防监控及移动设备等场景。

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。

智谱API

新用户免费领1亿tokens,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式。

Photosir 工具箱

Photosir 工具箱是一个在线的多功能摄影工具集,旨在为摄影师提供一系列便捷、高效的图片处理和管理工具。无论您是专业摄影师还是摄影爱好者,这里都有您需要的工具来提升您的摄影...

Fotor

Fotor是一款功能强大且对用户友好的全球型在线图片处理工具,多年来深耕图片处理技术,达到了相当高的水准。它提供了“拼图”和“修片”等基本功能,同时还包括一个新上线的“设计”功能...

Clipdrop

由人工智能提供支持的面向所有创作者的应用程序、插件和资源的终极生态系统。

Dzine

Dzine是一个集成了生成式人工智能的设计工具和在线设计平台,旨在通过人工智能技术提升创作者的创意想法,将其转化为专业的视觉效果。