文字

啤啤熊

一款简单易用的AI绘画工具,用户只需输入一段文字,选择相应的主题和风格,啤啤熊即可免费生成精美的图片。

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具,支持多语言实时语音转文字,适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能,兼容多平台,提升输入效率与文本质量。

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

Video Studio

一款利用先进AI技术将文本和图像转换为视频的工具,用户可以通过简单的操作,将文字或图片上传至平台,AI会自动生成高质量的视频。

度加创作工具

免费全流程 AI 创作工具,百度出品的一个人人可用的AIGC(AI Generated Content)创作平台。它利用AI技术降低内容生产的门槛,提升创作效率,一站式聚合了百度的AIGC能力,引领着...

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。