模型 - 智狐AI导航

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集，包含240万张图像和950万个问题-答案对，源自130万个PDF文档。数据集覆盖广泛，包括扫描图片、PDF文件和数字文档，且具有高质量的问答对。Docmatix 支持模型训练和微调，可用于训练视觉语言模型，提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

AI项目与工具 2025年06月12日 87 点赞 0 评论 562 浏览

长臂猿AIGC系统

长臂猿AIGC系统内置智能聊天对话机器人、AI绘图、AI模型训练、营销内容创作、企业虚拟AI员工等数十项AI功能，可以训练自己的AI机器人，不限制用户数量，支持源码私有化部署。

Ai开源项目 2025年06月05日 48 点赞 0 评论 562 浏览

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 563 浏览

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 563 浏览

xbench

xbench是红杉中国推出的AI基准测试工具，采用双轨评估体系，追踪模型的理论能力上限与实际落地价值。其长青评估机制动态更新测试内容，确保时效性。xbench包含科学问题解答和中文互联网深度搜索两个核心评估集，按季度或每月更新题目。工具还提供垂直领域智能体评测、实时更新与LeaderBoard功能，适用于模型能力评估、真实效用量化、产品迭代指导等场景，推动AI系统在真实场景中的效用提升。

AI项目与工具 2025年06月11日 33 点赞 0 评论 564 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 564 浏览

Modeli.ai

一个旨在使用AI模型为时尚产品优化和替代传统的拍照流程的AI模特生成工具。

电商运营 2025年06月05日 57 点赞 0 评论 564 浏览

Hulu AI

一个GPT、文心一言、Midjourney和Dall-E对话作图可以永久、不限次数使用的工具，Hulu AI会根据用户的需求，不断更新上线新的功能，比如图片解析、图片融合等等常用功能。

AI写作对话 2025年06月05日 75 点赞 0 评论 564 浏览

深言科技

深言科技是一家由孙茂松教授和其学生一同创办的创业公司，致力于使用世界领先的人工智能和自然语言处理技术，为数亿脑力劳动深言科技（DeepLang AI）者和数千万组织的信息处理全流...

创作工具 2026年06月22日 0 点赞 0 评论 564 浏览

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型（MLLM）。它通过整合视觉、语音和文本三种模态的信息，实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据，还支持流式文本-语音生成及跨模态信息交互，适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 564 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期