模型 - 智狐AI导航

Veo 3

Veo 3是谷歌推出的新一代视频生成模型，在I/O开发者大会上发布。它是首个能生成视频背景音效的模型，可合成画面并匹配人物对话和口型，支持1080P高质量视频生成，具备物理模拟与口型同步能力，可生成超过60秒的视频片段，并支持多种视觉风格。Veo 3整合了多项先进技术，适用于影视制作、广告营销及教育领域。

AI项目与工具 2025年06月11日 90 点赞 0 评论 816 浏览

LinFusion

LinFusion 是一种创新的图像生成模型，基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长，显著提高生成效率。LinFusion 支持零样本跨分辨率生成，并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上，LinFusion 能够生成高达 16K 分辨率的图像，广泛应用于艺术创作、游戏设计、虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 816 浏览

LAM

LAM是由微软开发的大型行动模型，能够理解和执行真实世界中的操作任务。它不仅能解析用户输入，还能生成具体行动指令，如启动程序或控制设备。LAM在Office等Windows应用中表现出色，任务完成率高于GPT-4。具备多模态输入理解、动态规划、环境交互和自主执行能力，适用于办公自动化、智能家居、客户服务等多个场景，显著提升任务执行效率和智能化水平。

AI项目与工具 2025年06月12日 26 点赞 0 评论 816 浏览

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

Ai开源项目 2025年06月05日 59 点赞 0 评论 816 浏览

Voiceflow

Voiceflow 是一款面向非技术用户的无代码对话式 AI 平台，具备直观的拖放界面和强大的自然语言处理能力。它支持复杂对话流程的设计、多渠道部署及团队协作，适用于客户服务自动化、虚拟助手开发、语音交互系统构建等多个领域，为企业和个人提供灵活且高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 816 浏览

探一下

探一下是一款依托于多模态大模型技术的AI视觉搜索工具，用户可通过其摄像头识别花草、宠物、潮玩等物体，获取旅游讲解、商品药品详情等信息，同时具备趣味解读图片的功能，支持文字翻译与场景触发滤镜，适用于多种生活场景。 ---

AI项目与工具 2025年06月12日 47 点赞 0 评论 816 浏览

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型，专注于提升推理能力。其采用COAT机制和两阶段训练框架，结合强化学习优化模型性能，具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出，广泛应用于科研、教育、智能客服等多个领域，代码、数据和模型均已开源。

AI项目与工具 2025年06月12日 79 点赞 0 评论 815 浏览

HealthGPT

HealthGPT是由多家高校与企业联合开发的医学视觉语言模型，支持医学图像分析、视觉问答、文本生成及多模态融合等任务。其核心技术包括异构低秩适应（H-LoRA）、分层视觉感知（HVP）和三阶段学习策略（TLS），可高效处理复杂医疗数据。模型适用于医学诊断、教育、研究及健康管理等多个场景，具有良好的适应性和实用性。

AI项目与工具 2025年06月12日 80 点赞 0 评论 815 浏览

Edify 3D

Edify 3D 是 NVIDIA 推出的一款高效3D资产生成工具，能够从文本或图像输入快速生成高质量的3D模型。其主要功能包括支持文本到3D、图像到3D的转换，生成高分辨率纹理与 PBR 材质，并具备快速生成、UV贴图和材质图生成等特性。该工具通过多视图扩散模型、Transformer 模型及跨视图注意力机制实现精准建模，适用于游戏开发、虚拟现实、影视制作及建筑可视化等多个领域。

AI项目与工具 2025年06月12日 40 点赞 0 评论 815 浏览

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的高效AI模型，采用Hybrid-Mamba-Transformer架构，提升推理效率并降低计算成本。支持快速响应、多领域推理、内容创作及多模态生成，适用于对话、代码、逻辑推理等场景。兼具短思维链与长思维链能力，性能对标行业领先模型。

AI项目与工具 2025年06月12日 86 点赞 0 评论 815 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期