多语言支持
CosyVoice 2.0
CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。
ImageUpscalerAI
一个免费的图像无损放大工具,使用AI技术来轻松快速地提高图像、照片、卡通图片等的分辨率和质量。
OpenAudio S1
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足
Claude 3.7 Max
Claude 3.7 Max 是 Cursor 推出的高性能 AI 编程助手,支持 200k 上下文窗口与 200 次工具调用,适用于复杂代码任务和大规模项目开发。具备强大的代码理解、编辑与维护能力,适合需要深度分析和优化的开发者。采用按需付费模式,适用于专业用户。