多语言支持

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

Play.HT

PlayHT是一款使用先进技术将文本转换为逼真、人类声音的AI语音生成器平台。PlayHT提供600多种在142种语言和口音中可用的AI语音,为创建引人入胜和专业声音内容提供了广泛的功能和用途。

AI Letter Generator

AI Letter Generator是一款专注于信件生成的人工智能工具,支持商务信函、求职信、个人信件及感谢信等多种类型信件的创作。其核心功能包括多语言支持、隐私保护、专业格式化选项等,旨在为用户提供高效、安全且专业的信件撰写体验。

通义灵码

通义灵码,你的智能编码助手,为开发者提供行级和函数级代码续写、单元测试生成、代码注释生成、研发智能问答等能力,助你高质高效地完成编码工作。

Claude 3.7 Max

Claude 3.7 Max 是 Cursor 推出的高性能 AI 编程助手,支持 200k 上下文窗口与 200 次工具调用,适用于复杂代码任务和大规模项目开发。具备强大的代码理解、编辑与维护能力,适合需要深度分析和优化的开发者。采用按需付费模式,适用于专业用户。

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

ImageUpscalerAI

一个免费的图像无损放大工具,使用AI技术来轻松快速地提高图像、照片、卡通图片等的分辨率和质量。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

豆包向量化API

Doubao-embedding是字节跳动推出的语义向量化API,支持中英文文本处理及长文本向量化,提供多种维度的向量输出和丰富的SDK支持,适用于搜索引擎、推荐系统、知识图谱构建和自然语言处理等多种应用场景。