生成

Frames

Frames是一款由Runway开发的AI图像生成工具,其核心功能在于通过风格控制与高视觉保真度,支持用户生成一致且多样化的高质量图像。该工具可应用于电影、游戏、艺术创作等多个领域,帮助用户探索创意方向并实现精准的设计目标。其主要特点包括风格化图像生成、创意灵活性以及广泛的场景适配能力。

FutureKid

FutureKid是一款基于AI技术预测孩子未来长相的应用,通过分析父母面部特征生成逼真图像。它支持个性化定制,注重隐私保护,确保数据安全。适用于家庭规划、婚礼纪念及创意设计等多种场景,提供简单高效的用户体验。

CODEPAL

CODEPAL是一款AI驱动的编程辅助工具,支持30多种编程语言,具备代码生成、解释、文档生成、审阅及错误检测等功能。它适用于快速原型开发、教育培训、代码审查优化以及跨语言开发等多种场景,帮助用户提高编码效率和代码质量。

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架,通过与高级模型API交互获取数据对,结合预训练的视觉语言模型(VLMs)动态优化训练集,大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练,显著提升了生成图像的质量和多样性,广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

擎舵

擎舵是百度营销推出的多模态AIGC创意生产平台,专注于视频、图片、文字等内容的智能生成。平台通过百度大模型技术支持,实现一键生成视频、图片、文字,自动识别视频素材内容,生成营销图,制作数字人视频,支持图片数字人生成及数字人形象与语音定制。擎舵服务于教育、汽车、旅游等多个行业,提供全流程AI赋能,帮助用户提升营销效率。

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架,通过多视图扩散模型和视图筛选机制生成高质量3D模型,支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型(FlexRM),结合三平面表示与3D高斯绘制技术,实现高效且详细的三维重建,广泛应用于游戏开发、AR/VR、影视制作等领域。

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列,并采用视角集成注意力模块增强视频的一致性和连贯性,支持用户精准控制相机运动。此外,CAVIA利用多种数据源进行联合训练,优化生成视频的质量和真实感,在虚拟现实、增强现实以及电影制作等领域具有重要价值。

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架,支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计,能够快速生成高质量图像并提升推理效率。

DocuWriter.ai

DocuWriter.ai是一款基于AI技术的开发工具,专注于自动生成代码文档、API文档、测试套件及代码重构。它通过自动化流程提升开发效率和文档质量,支持多语言开发,具备UML图生成、代码注释生成、代码测试套件生成等功能,广泛应用于软件开发、API集成、遗留代码维护及教育培训等领域。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。