生成 - 智狐AI导航

Sparkify

Sparkify是谷歌推出的AI动画视频生成工具，基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后，Sparkify能在2分钟内生成直观的动画短视频，讲解知识点。其多模态处理能力结合Google Search数据，确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域，提升理解效率和传播效果。目前处于内测阶段，可通过官网加入等候列表。

AI项目与工具 2025年06月11日 24 点赞 0 评论 694 浏览

Head

Head AI 是一款基于 AI 技术的全球领先市场营销工具，能够自动生成跨平台营销策略，并精准计算病毒式传播路径，帮助品牌主和创作者将市场预算转化为可量化增长。其主要功能包括品牌 DNA 生成、营销策略生成与执行、传播路径优化、预算优化与 ROI 提升以及数据驱动的持续优化。Head AI 已服务于多个领域，覆盖全球 200 多个国家和地区，适用于电商、科技、游戏和个人品牌等多种场景。

AI项目与工具 2025年06月11日 62 点赞 0 评论 581 浏览

凹凸工坊

凹凸工坊是一款专业的在线AI手写稿件生成工具，支持将Word文档一键转换为真实的手写稿图片。用户可选择多种手写字体、纸张背景，并调整涂改率和凌乱度，模拟真实手写场景。生成的图片无水印且支持高清打印（600dpi），具备超级DIY功能和较大的文件大小限制，适用于作业、书信、创意写作等多种场景。

AI项目与工具 2025年06月11日 70 点赞 0 评论 670 浏览

Stitch是谷歌实验室推出的基于生成式AI的工具，能够将简单的英语描述或图像快速转化为用户界面（UI）设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力，支持文本、图像输入，并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码，支持HTML、CSS和JavaScript，同时与Figma无缝集成，便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

AI项目与工具 2025年06月11日 91 点赞 0 评论 807 浏览

BAGEL

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 501 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 704 浏览

AutoBE

AutoBE 是一款 AI 驱动的后端服务器代码生成工具，通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技术栈构建，强调“氛围编码”，结合瀑布模型和螺旋模型的优点，确保代码的可靠性和安全性。其主要功能包括需求分析、数据库模式生成、API 接口设计与代码生成、测试代码生成和代码实现，适用于快速开发新项目、提高开发效率、教学与

AI项目与工具 2025年06月11日 24 点赞 0 评论 536 浏览

Imagen 4

Imagen 4是谷歌推出的最新图像生成AI模型，支持高达2K分辨率的图像生成，具备出色的细节呈现能力，可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升，适合广告、漫画等设计场景。支持多种艺术风格，包括超现实、抽象、插图和摄影，满足多样化创作需求。同时，Imagen 4拥有快速生成模式和高效的特征蒸馏技术，提升了生成速度，并已集成到Gemini应用、Google Worksp

AI项目与工具 2025年06月11日 76 点赞 0 评论 714 浏览

Flow

Flow是谷歌推出的AI电影制作工具，整合了Veo 3、Imagen 4和Gemini 2.5等多个AI模型，能根据文本提示生成完整的电影场景或短片，保持连贯性。用户可通过“Camera Controls”操作镜头，“Scenebuilder”编辑场景，“Asset Management”管理创意元素，并通过“Flow TV”学习交流。目前仅对美国的谷歌AI Pro和AI Ultra订阅用户开放。

AI项目与工具 2025年06月11日 54 点赞 0 评论 791 浏览

II

II-Agent 是一个开源的 Agent 框架，通过与大型语言模型（LLM）交互，简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口，适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AI项目与工具 2025年06月11日 67 点赞 0 评论 533 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期