生成

Sparkify

Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。其多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域,提升理解效率和传播效果。目前处于内测阶段,可通过官网加入等候列表。

Head

Head AI 是一款基于 AI 技术的全球领先市场营销工具,能够自动生成跨平台营销策略,并精准计算病毒式传播路径,帮助品牌主和创作者将市场预算转化为可量化增长。其主要功能包括品牌 DNA 生成、营销策略生成与执行、传播路径优化、预算优化与 ROI 提升以及数据驱动的持续优化。Head AI 已服务于多个领域,覆盖全球 200 多个国家和地区,适用于电商、科技、游戏和个人品牌等多种场景。

凹凸工坊

凹凸工坊是一款专业的在线AI手写稿件生成工具,支持将Word文档一键转换为真实的手写稿图片。用户可选择多种手写字体、纸张背景,并调整涂改率和凌乱度,模拟真实手写场景。生成的图片无水印且支持高清打印(600dpi),具备超级DIY功能和较大的文件大小限制,适用于作业、书信、创意写作等多种场景。

Stitch

Stitch是谷歌实验室推出的基于生成式AI的工具,能够将简单的英语描述或图像快速转化为用户界面(UI)设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力,支持文本、图像输入,并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码,支持HTML、CSS和JavaScript,同时与Figma无缝集成,便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型,基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入,可生成结构化文本输出,并具备音频转录、情感分析等功能。可在本地设备运行,响应时间低至 50 毫秒,适用于语音助手、内容生成和学术任务定制。

AutoBE

AutoBE 是一款 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技术栈构建,强调“氛围编码”,结合瀑布模型和螺旋模型的优点,确保代码的可靠性和安全性。其主要功能包括需求分析、数据库模式生成、API 接口设计与代码生成、测试代码生成和代码实现,适用于快速开发新项目、提高开发效率、教学与

Imagen 4

Imagen 4是谷歌推出的最新图像生成AI模型,支持高达2K分辨率的图像生成,具备出色的细节呈现能力,可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升,适合广告、漫画等设计场景。支持多种艺术风格,包括超现实、抽象、插图和摄影,满足多样化创作需求。同时,Imagen 4拥有快速生成模式和高效的特征蒸馏技术,提升了生成速度,并已集成到Gemini应用、Google Worksp

Flow

Flow是谷歌推出的AI电影制作工具,整合了Veo 3、Imagen 4和Gemini 2.5等多个AI模型,能根据文本提示生成完整的电影场景或短片,保持连贯性。用户可通过“Camera Controls”操作镜头,“Scenebuilder”编辑场景,“Asset Management”管理创意元素,并通过“Flow TV”学习交流。目前仅对美国的谷歌AI Pro和AI Ultra订阅用户开放。

II

II-Agent 是一个开源的 Agent 框架,通过与大型语言模型(LLM)交互,简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口,适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。