文字 - 智狐AI导航

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型，专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐，支持Token级图文交互，提升了多模态任务性能。其基于自研的TokenIT数据集进行训练，涵盖2000万张图像和18亿高质量Token-Mask对，覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域，具有广泛的适用性和

AI项目与工具 2025年06月12日 90 点赞 0 评论 660 浏览

Notato

Notato 是一款基于 AI 的笔记应用，支持音频、视频、文档及网页内容的自动转录与结构化整理，生成摘要、闪卡和测验，适用于学习、会议、资料整理等多种场景。其具备多语言翻译、错题分析、后台录音等功能，提升信息处理与知识管理效率。

AI项目与工具 2025年06月11日 74 点赞 0 评论 667 浏览

鬼手剪辑GhostCut

高效实现视频去字幕、视频翻译和视频混剪等

Ai语音工具 2026年06月21日 0 点赞 0 评论 670 浏览

edge

edge-tts 是一个开源的AI文字转语音项目，支持超过40种语言和300多种声音。该项目利用微软Azure Cognitive Services技术，能够将文本信息转换为流畅自然的语音输出。edge-tts 提供了丰富的语言和声音选择，易于集成且具有高度可定制性。其主要功能包括多语言支持、多样声音选择、流畅自然语音、易于集成的API以及开源特性。edge-tts 广泛应用于辅助技术、客户服务、

AI项目与工具 2025年06月12日 86 点赞 0 评论 682 浏览

Edimakor

Edimakor是一款基于AI技术的视频编辑工具，具备AI字幕翻译、智能脚本生成、文字转语音、AI视频生成等多种功能，大幅简化视频制作流程，提升工作效率。它适用于内容创作者、教育机构、企业宣传等多个领域，支持多语言字幕翻译与配音，助力全球化传播。

AI项目与工具 2025年06月12日 28 点赞 0 评论 685 浏览

度加创作工具

免费全流程 AI 创作工具，百度出品的一个人人可用的AIGC（AI Generated Content）创作平台。它利用AI技术降低内容生产的门槛，提升创作效率，一站式聚合了百度的AIGC能力，引领着...

Ai视频生成 2026年06月21日 0 点赞 0 评论 687 浏览

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 690 浏览

68媒视频神器

一款集视频和音频转文字、短视频快速提取字幕、短视频去水印等功能的视频处理工具。

视频剪辑 2025年06月05日 41 点赞 0 评论 696 浏览

Word

我们的文字作为图像插图在不同的字体和不同的文本概念。使用我们的方法，语义调整的字母完全自动创建，然后可以用于进一步的创造性设计，正如我们在这里所演示的那样。

Ai绘画生成 2026年06月21日 0 点赞 0 评论 699 浏览

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别（ASR）模型，采用 FastConformer 和 TDT 架构，具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异，实时因子高达 3386，适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

AI项目与工具 2025年06月11日 36 点赞 0 评论 700 浏览

文字

首页

文字

列表

默认

浏览次数

发布日期