多语言

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。

BoomCut爆剪辑

小影科技旗下的 AI 内容创意产品与服务平台,提供一站式视频本地化解决方案,涵盖视频翻译、模特换脸、音色克隆等功能。

CodeWP

CodeWP是一款专为WordPress开发者及内容创作者打造的人工智能平台,提供智能代码生成、AI聊天支持、安全扫描和故障排查等功能。通过自然语言输入,用户可轻松生成复杂代码片段与插件,同时具备内置测试套件以确保代码质量和安全性,适用于多种应用场景,包括快速开发、网站定制、故障排查、安全维护等。

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。

Color4Bg

好用的酷炫抽象动态背景生成器,免费导出图片视频或JS脚本,Color4bg.com 能够让你轻松生成动态的、可自定义彩色的抽象背景。

Font Squirrel

中文名:字体松鼠,一个广受欢迎提供高质量免费商用字体下载的字体网站。用户可以在Font Squirrel找到数千种完全合法的免费字体,适用于各种设计项目。

Composio

Composio 是一款专为简化 AI 智能体开发和部署设计的辅助工具,支持超过100种集成工具,通过简单的代码调用多种工具和框架。它提供丰富的 API 和插件系统,支持多种身份验证协议,适用于自动化软件开发、内容管理、数据管理等多种场景,帮助开发者构建和管理高效的 AI 智能体。

Checksub

Checksub 是一个利用人工智能技术提供视频和音频本地化服务的平台,它通过 AI 驱动的字幕生成和配音功能,帮助用户将视频内容翻译成不同语言,从而扩大观众范围。