生成 - 智狐AI导航

BAGEL

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 496 浏览

Stitch

Stitch是谷歌实验室推出的基于生成式AI的工具，能够将简单的英语描述或图像快速转化为用户界面（UI）设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力，支持文本、图像输入，并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码，支持HTML、CSS和JavaScript，同时与Figma无缝集成，便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

AI项目与工具 2025年06月11日 91 点赞 0 评论 805 浏览

凹凸工坊

凹凸工坊是一款专业的在线AI手写稿件生成工具，支持将Word文档一键转换为真实的手写稿图片。用户可选择多种手写字体、纸张背景，并调整涂改率和凌乱度，模拟真实手写场景。生成的图片无水印且支持高清打印（600dpi），具备超级DIY功能和较大的文件大小限制，适用于作业、书信、创意写作等多种场景。

AI项目与工具 2025年06月11日 70 点赞 0 评论 670 浏览

Head

Head AI 是一款基于 AI 技术的全球领先市场营销工具，能够自动生成跨平台营销策略，并精准计算病毒式传播路径，帮助品牌主和创作者将市场预算转化为可量化增长。其主要功能包括品牌 DNA 生成、营销策略生成与执行、传播路径优化、预算优化与 ROI 提升以及数据驱动的持续优化。Head AI 已服务于多个领域，覆盖全球 200 多个国家和地区，适用于电商、科技、游戏和个人品牌等多种场景。

AI项目与工具 2025年06月11日 62 点赞 0 评论 580 浏览

Sparkify

Sparkify是谷歌推出的AI动画视频生成工具，基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后，Sparkify能在2分钟内生成直观的动画短视频，讲解知识点。其多模态处理能力结合Google Search数据，确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域，提升理解效率和传播效果。目前处于内测阶段，可通过官网加入等候列表。

AI项目与工具 2025年06月11日 24 点赞 0 评论 692 浏览

Devstral

Devstral是由Mistral AI和All Hands AI推出的编程专用AI模型，专为软件工程任务设计。它在SWE-Bench Verified基准测试中表现优异，能处理复杂代码库、识别组件关系并修复细微错误。该工具轻量级，支持本地部署和企业级应用，具备代码生成与优化、集成开发工具、持续学习等能力，适用于本地开发、企业开发、IDE集成等多种场景。

AI项目与工具 2025年06月11日 35 点赞 0 评论 1025 浏览

MMaDA

MMaDA（Multimodal Large Diffusion Language Models）是由普林斯顿大学、清华大学、北京大学和字节跳动联合开发的多模态扩散模型，支持跨文本推理、多模态理解和文本到图像生成等多种功能。其采用统一的扩散架构和模态不可知设计，结合混合长链推理微调策略与UniGRPO强化学习算法，提升跨模态任务性能。MMaDA在多项任务中表现优异，适用于内容创作、教育辅助、智能客

AI项目与工具 2025年06月11日 80 点赞 0 评论 725 浏览

MoviiGen 1.1

MoviiGen 1.1是由ZulutionAI推出的专注于生成电影级画质视频的AI模型，基于Wan2.1微调而成。它在氛围营造、镜头运动和物体细节保留方面表现优异，支持720P和1080P分辨率，适用于高保真场景和专业电影应用。模型具备提示扩展功能，可优化生成效果，并采用序列并行与环形注意力等技术提升性能。其应用场景包括电影制作、广告、游戏开发、VR/AR及教育等领域。

AI项目与工具 2025年06月11日 53 点赞 0 评论 816 浏览

Claude 4

Claude 4 是 Anthropic 公司推出的新一代 AI 模型，包括 Claude Opus 4 和 Claude Sonnet 4。Claude Opus 4 擅长复杂任务和长时间运行的工作流，如代码生成、优化和调试，具有强大的推理能力。Claude Sonnet 4 在编程和推理上表现优异，适合日常使用。两者均支持工具使用、记忆管理、多模态处理等功能，提升 AI Agent 的效率与实

AI项目与工具 2025年06月11日 36 点赞 0 评论 752 浏览

DMind

DMind是由DMind研究机构开发的专为Web3领域优化的大型语言模型，针对区块链、去中心化金融和智能合约等场景深度优化。采用RLHF技术对齐，性能在Web3专项测试中表现优异，推理成本仅为大模型的十分之一。提供DMind-1和DMind-1-mini两个版本，适用于复杂任务和轻量级部署。支持智能合约生成与验证、DeFi交易代理部署、多轮对话交互等功能，基于Transformer架构，结合专业数

AI项目与工具 2025年06月11日 70 点赞 0 评论 598 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期