模型 - 智狐AI导航

VideoLLaMA3

VideoLLaMA3 是阿里巴巴开发的多模态基础模型，支持视频与图像的深度理解和分析。基于 Qwen 2.5 架构，结合先进视觉编码器与语言生成能力，具备高效时空建模与多语言处理能力。适用于视频内容分析、视觉问答、字幕生成等场景，提供多种参数版本，支持灵活部署。

AI项目与工具 2025年06月12日 87 点赞 0 评论 466 浏览

Playwright MCP是微软推出的轻量级浏览器自动化工具，基于Model Context Protocol（MCP）协议，通过Playwright的可访问性树实现与网页的交互，无需依赖视觉模型或截图。支持多种浏览器，提供丰富的交互功能，如点击、拖动、输入文本等，适用于与大语言模型结合使用。具备结构化数据交互、网络请求管理、测试脚本生成等功能，支持无头和有头模式运行，适用于自动化测试、网页操作

AI项目与工具 2025年06月11日 22 点赞 0 评论 467 浏览

NarratoAI

NarratoAI是一款基于AI技术的影视解说和编辑工具，它利用大型语言模型（LLM）、计算机视觉和自然语言处理技术来理解视频内容，自动生成解说文案，并将文案转化为配音，同时进行视频剪辑和字幕生成。该工具支持个性化定制，可以满足不同用户的视频制作需求，简化视频制作流程，帮助非专业人士快速制作出专业水准的视频内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 467 浏览

靠谱AI

一个AI智能体平台，为你聚合业内领先的多种通用大模型，让你可以按需向多个或某个AI机器人进行多轮提问对话，获取即时满意的答案，或是得到你满意的作品。

AI写作对话 2025年06月05日 34 点赞 0 评论 467 浏览

怪兽智能AI知识库

怪兽智能AI知识库是一个集成了企业知识管理和智能问答功能的系统，它通过AI技术帮助企业提升服务效率和客户体验。

Ai平台模型 2026年06月21日 0 点赞 0 评论 468 浏览

GPT智库

一款强大的人工智能大模型综合应用，提供智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能。

Ai平台模型 2025年06月05日 27 点赞 0 评论 469 浏览

FlexTok

FlexTok 是由EPFL与苹果联合开发的图像处理技术，通过将图像转为离散标记序列实现高效压缩与生成。支持8K视频实时渲染，压缩率提升300%，功耗降低45%。具备无损超分辨率重建和灵活图像生成能力，适用于智能家居、安防监控及移动设备等场景。

AI项目与工具 2025年06月12日 70 点赞 0 评论 470 浏览

StoryPlay AI

一个致力于为短剧内容创作提供可视化流程，实现剧本策划、剧本创作、剧本分镜创作等围绕短剧创作全工作流的AI赋能，实现创作者5-10倍的降本增效的AI短剧剧本创作工具

AI写作对话 2025年06月05日 55 点赞 0 评论 470 浏览

Mistral Saba

Mistral Saba 是一款面向中东和南亚地区的定制化 AI 模型，具备 240 亿参数，专注于阿拉伯语及南亚语言（如泰米尔语、马拉雅拉姆语）的处理。其优势在于高效部署、低资源占用和高准确性，适合需要文化背景理解的场景。可通过微调应用于多个行业，并支持 API 和本地部署，适用于对话支持、专业领域知识生成及文化内容创作。

AI项目与工具 2025年06月12日 65 点赞 0 评论 471 浏览

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型，支持39种语言，具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等，同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构，适用于多语言客户服务、教育、跨文化交流等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 471 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期