R

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型,具备检索增强、上下文学习及超分辨率技术,能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值,同时支持学术研究和技术探索。

PixArt

PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

Trae国内版

Trae国内版是字节跳动推出的AI IDE,支持代码生成、补全、优化及自然语言指令生成。其核心功能包括Builder模式、智能体协作、多模型切换及上下文理解,提升开发效率。界面简洁易用,适配中文环境,适合从初学者到专业开发者使用。

Meissonic

Meissonic是一款由阿里巴巴集团与多家高校联合开发的文本到图像合成模型,基于掩蔽图像建模技术,结合多模态和单模态Transformer层、高级位置编码策略及优化采样条件,实现了高分辨率图像生成、文本到图像转换、零样本图像编辑等功能。其高效性能使其适用于多种场景,包括艺术创作、媒体娱乐、广告营销、教育及电子商务等领域。 ---

Spring.new

Spring.new 是一款低代码/无代码 AI 开发平台,允许用户通过自然语言创建和部署定制化应用,无需编程。支持多工具集成,具备实时调整功能,并兼容多种 AI 模型,适用于营销、反馈管理及轻量级 CRM 构建等多种场景。

Wegic.ai

一款面向未来的 AI网页设计师,通过简单的聊天等多模态交互来完成网站的设计、修改和上线全流程。

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

Patreon

一个创作者会员制平台,Patreon内容创作者可以通过向订阅者(称为赞助人)提供独家内容来赚取收入。

Zion

一个全面的无代码平台,用于开发和集成AI智能体应用。它的特点包括一站式开发环境、灵活的生成式AI应用开发框架、多数据源支持、结构化输出、工具调用能力以及商业化应用开发的支持。