语言支持

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住...

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

Svg.la

Svg.la 是一款基于人工智能的 SVG 文件生成与转换工具,支持文本转 SVG 和图像转 SVG 功能。用户可以输入文本提示或上传图像,生成高质量、可缩放的矢量图形,广泛应用于品牌设计、图标制作、艺术作品转换及网页和移动应用开发等领域,满足多语言需求。

speakSync

AI语音翻译器,无缝语音和文本转换,一款基于ChatGPT的AI语音翻译应用,支持70多种语言。它可以实现面对面语音通话。

Viewly AI

一款强大的AI图片识别应用,Viewly AI能识别图片中的内容、AI作诗、拍照翻译成多国语言。

Bearly.AI

Bearly,AI阅读总结、写作和内容生成助手。

PearOCR

PearOCR,一个完全免费的在线OCR图像转文字网站。支持简体中文、繁体中文、英文、日文、韩文五种语言。

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。