数据集 - 智狐AI导航

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型，专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐，支持Token级图文交互，提升了多模态任务性能。其基于自研的TokenIT数据集进行训练，涵盖2000万张图像和18亿高质量Token-Mask对，覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域，具有广泛的适用性和

AI项目与工具 2025年06月12日 90 点赞 0 评论 660 浏览

StableCode

StableCode，一个用于代码生成的大语言模型。StableCode 基于 GPT-NeoX 构建，该模型通过指令模型和具体应用示例进行改进，用于解决复杂的编程任务。

Ai编程建站 2025年06月05日 12 点赞 0 评论 654 浏览

Wisemodel

Wisemodel，始智AI团队打造的中立开放AI开源社区平台，旨在打造中国版 “HuggingFace”。

Ai学习资源 2025年06月05日 68 点赞 0 评论 651 浏览

DNA

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库，它为广泛的研究任务提供了丰富的数据和高质量的注释。

创作工具 2026年06月21日 0 点赞 0 评论 649 浏览

Lucidchart

由Lucid Software开发的在线图表制作和可视化工具，支持创建流程图、组织结构图、思维导图、UML、ERD、BPMN等多种图表类型，并提供实时协作功能。

教育学习 2025年06月05日 65 点赞 0 评论 637 浏览

DuoAttention

DuoAttention是由MIT韩松团队提出的新型框架，通过区分“检索头”和“流式头”两种注意力机制，显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用，加速了解码和预填充过程，并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 636 浏览

阿里达摩院遥感AI大模型

阿里达摩院遥感AI大模型是一个强大的遥感数据处理和分析平台，它通过提供丰富的数据资源、先进的AI工具和灵活的开发环境，为地球科学研究、环境监测、农业管理等领域提供了有力的...

创作工具 2026年06月21日 0 点赞 0 评论 635 浏览

VideoPainter

VideoPainter是由多所高校及科研机构联合开发的视频修复与编辑框架，采用双分支架构，结合轻量级上下文编码器和扩散模型，实现高效背景保留与前景生成。支持插件式操作，具备长视频对象一致性维持能力，并构建了大规模视频修复数据集，广泛应用于影视、广告、教育等领域。

AI项目与工具 2025年06月12日 33 点赞 0 评论 627 浏览

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架，通过与高级模型API交互获取数据对，结合预训练的视觉语言模型（VLMs）动态优化训练集，大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练，显著提升了生成图像的质量和多样性，广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 622 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 622 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期