模型 - 智狐AI导航

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 698 浏览

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架，基于DINOv2模型，能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态，支持身份和表情的解耦，并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

AI项目与工具 2025年06月11日 88 点赞 0 评论 728 浏览

Imagen 4是谷歌推出的最新图像生成AI模型，支持高达2K分辨率的图像生成，具备出色的细节呈现能力，可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升，适合广告、漫画等设计场景。支持多种艺术风格，包括超现实、抽象、插图和摄影，满足多样化创作需求。同时，Imagen 4拥有快速生成模式和高效的特征蒸馏技术，提升了生成速度，并已集成到Gemini应用、Google Worksp

AI项目与工具 2025年06月11日 76 点赞 0 评论 704 浏览

Flow

Flow是谷歌推出的AI电影制作工具，整合了Veo 3、Imagen 4和Gemini 2.5等多个AI模型，能根据文本提示生成完整的电影场景或短片，保持连贯性。用户可通过“Camera Controls”操作镜头，“Scenebuilder”编辑场景，“Asset Management”管理创意元素，并通过“Flow TV”学习交流。目前仅对美国的谷歌AI Pro和AI Ultra订阅用户开放。

AI项目与工具 2025年06月11日 54 点赞 0 评论 785 浏览

II

II-Agent 是一个开源的 Agent 框架，通过与大型语言模型（LLM）交互，简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口，适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AI项目与工具 2025年06月11日 67 点赞 0 评论 529 浏览

Veo 3

Veo 3是谷歌推出的新一代视频生成模型，在I/O开发者大会上发布。它是首个能生成视频背景音效的模型，可合成画面并匹配人物对话和口型，支持1080P高质量视频生成，具备物理模拟与口型同步能力，可生成超过60秒的视频片段，并支持多种视觉风格。Veo 3整合了多项先进技术，适用于影视制作、广告营销及教育领域。

AI项目与工具 2025年06月11日 90 点赞 0 评论 819 浏览

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客工具，基于流式模型构建，可将文本秒级转化为双人对话式播客。具有低成本、高时效、强互动特点，解决了传统AI播客内容重复、不够口语化的问题。支持低时延与可打断、深度搜索、高效创作、超长文本转播客等功能，适用于教育、娱乐、心理咨询、内容营销和有声读物制作等场景。

AI项目与工具 2025年06月11日 72 点赞 0 评论 480 浏览

Windows AI Foundry

Windows AI Foundry 是微软推出的全新 AI 开发平台，提供从模型选择、优化、微调到部署的全生命周期支持。平台整合 Windows ML，支持在多种硬件上高效部署模型，并基于 Foundry Local 提供优化后的开源模型库。同时，提供即用型 AI API 和 LoRA 技术，帮助开发者快速集成和微调模型，提升开发效率与灵活性。

AI项目与工具 2025年06月11日 11 点赞 0 评论 649 浏览

MCP Servers

MCP Servers是字节跳动推出的大模型生态平台，为开发者提供高效、灵活的大模型开发与部署环境。通过MCP协议集成搜索、数据库、API等工具，支持模块化开发和全链路闭环。平台整合MCP Market、火山方舟和Trae，实现从工具调用到应用部署的全流程。支持Local和Remote部署模式，涵盖自动化代码生成、智能数据库运维、跨仓库调试等应用场景，助力开发者提升效率。

AI项目与工具 2025年06月11日 21 点赞 0 评论 861 浏览

WeClone

WeClone是一款基于聊天记录创建数字分身的AI工具，通过微调大语言模型生成个性化风格的数字分身，并支持绑定到微信、QQ、Telegram等平台。它提供聊天记录预处理、语音克隆、隐私保护和本地化部署等功能，确保数据安全。用户可灵活配置模型，应用于个人助理、内容创作、情感陪伴等多个场景。

AI项目与工具 2025年06月11日 38 点赞 0 评论 830 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期