创作

Meissonic

Meissonic是一款由阿里巴巴集团与多家高校联合开发的文本到图像合成模型,基于掩蔽图像建模技术,结合多模态和单模态Transformer层、高级位置编码策略及优化采样条件,实现了高分辨率图像生成、文本到图像转换、零样本图像编辑等功能。其高效性能使其适用于多种场景,包括艺术创作、媒体娱乐、广告营销、教育及电子商务等领域。 ---

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

Kimi浏览器插件

Kimi浏览器插件是一款集成即时问答、全文摘要和划线互动功能的工具,支持用户通过划线提问获取上下文相关答案,并可一键生成文章摘要,提高阅读效率。划线互动功能还允许用户查看其他用户对特定文本的疑问和解答,增强社区互动。插件兼容多种浏览器,提供简洁的用户体验,适用于学术研究、资料查询、学习新知识、专业信息检索、内容创作等多个应用场景。

KataList Ai

一个利用AI将剧本转化为视觉故事的工具。通过KataList Ai可以生成创意提案、故事板和视频,并提供音乐和旁白等一站式服务。

Patreon

一个创作者会员制平台,Patreon内容创作者可以通过向订阅者(称为赞助人)提供独家内容来赚取收入。

Zeemo.ai

Zeemo,这是一款快速的 AI 字幕工具,可以为您的视频自动生成和翻译字幕。

DemoFusion

DemoFusion是一个技术框架,旨在低成本生成高分辨率图像。该框架通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模型能够在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像转化为高清晰度图像。DemoFusion采用渐进式增强、跳跃残差和扩张采样机制,确保高分辨率图像生成的同时,保持图像的全局语义一致性和细节质量。适用于艺术创作、游戏开发、电影

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型,支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本,专注于广告视频创作,具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构,适用于广告、教育、娱乐等多个领域,提升了内容创作效率与质量。

SigStyle

SigStyle是一款由多所高校与Adobe合作开发的签名风格迁移框架,能将单张风格图像的视觉特征(如几何结构、色彩和笔触)精准迁移到目标图像,同时保持内容的语义和结构。其核心技术基于个性化文本到图像扩散模型,结合超网络和时间感知注意力交换技术,实现高效且高质量的风格迁移。支持多种应用场景,如艺术创作、时尚设计、影视制作等,具备灵活性和广泛适用性。

Amazon Nova

Amazon Nova是亚马逊云服务推出的一套强大的AI基础模型系列,涵盖文本、图像和视频生成等多个领域。其核心产品包括Amazon Nova Micro(专注文本处理)、Amazon Nova Lite(多模态低成本模型)、Amazon Nova Pro(多模态平衡型模型)、Amazon Nova Premier(复杂推理模型)、Amazon Nova Canvas(图像生成模型)和Amazon