多语言

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型,支持 119 种语言,参数规模从 0.6B 到 8B。它能够精准捕捉文本语义,支持多语言处理、高效检索和语义相关性排序,并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异,适用于智能搜索、推荐系统、问答系统和教育领域等场景。

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

PearOCR

PearOCR,一个完全免费的在线OCR图像转文字网站。支持简体中文、繁体中文、英文、日文、韩文五种语言。

AIChatru.ru

AIChatru.ru 是一个提供多种先进AI大模型的免费在线聊天平台。它支持多种语言,提供快速、准确的回应。主要功能包括多样化的AI模型、多语言支持、免费在线使用和快速响应。适用于技术爱好者、学生和研究人员、专业人士、语言学习者以及企业用户等。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

TalkingAvatar.ai

TalkingAvatar.ai 是一款集 AI 技术与虚拟形象创作于一体的平台,支持视频内容的重写、重配音以及多语言适配。其核心功能包括语音克隆、唇形同步、文本编辑语音等,可满足视频内容创作、广告定制、多语言电商、教育视频制作等多种应用场景。平台提供灵活的订阅方案,支持多种语言和语音模型,帮助用户轻松实现视频内容的个性化和全球化。

Memo AI

Memo AI 是一款AI 驱动的视频、播客转文字工具。

ViralMagic AI

一个以AI驱动的AI网红营销和视频创作平台,主要提供自动化视频创建和活动管理服务,帮助品牌提升在社交媒体平台上的影响力。

Codeium

Codeium是现代编码超级大国,是一个免费的人工智能代码完成工具。它支持超过20多种语言,并与您最喜欢的ide集成。