语言支持 - 智狐AI导航

Fish Audio

Fish Audio是一款生成式AI文本转语音（TTS）和声音克隆平台，支持多种语言和声音风格，可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音，并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域，满足个性化语音内容生成需求。

AI项目与工具 2025年06月11日 79 点赞 0 评论 517 浏览

PageOn.ai是一个AI驱动的内容创作平台，帮助用户快速生成高质量的视觉内容。通过AI Agent理解用户需求，自动生成动态视觉元素，如互动图表、3D模型和媒体内容。用户只需描述外观和感觉，AI即可转化为视觉表达。平台具备深度搜索功能，支持拖放和斜杠命令组合内容，打造个性化视觉故事。主要功能包括AI生成幻灯片、智能演示、数据图表生成、实时语音交互和多人协作等，适用于教学演示、商务会议、项目汇报

AI项目与工具 2025年06月11日 72 点赞 0 评论 848 浏览

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 656 浏览

MoonCast

MoonCast 是一个零样本播客生成系统，能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练，支持中文和英文，生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本，并利用语音合成模块转换为最终音频，具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强，适用于内容创作、教

AI项目与工具 2025年06月11日 63 点赞 0 评论 549 浏览

Qwen3 Embedding

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型，支持 119 种语言，参数规模从 0.6B 到 8B。它能够精准捕捉文本语义，支持多语言处理、高效检索和语义相关性排序，并可通过个性化优化提升用户体验。在 MTEB 等任务中表现优异，适用于智能搜索、推荐系统、问答系统和教育领域等场景。

AI项目与工具 2025年06月11日 37 点赞 0 评论 661 浏览

Qwen3 Reranker

Qwen3 Reranker是阿里巴巴通义千问团队推出的文本重排序模型，属于Qwen3模型家族。它采用单塔交叉编码器架构，能够对文本对进行相关性评估并输出得分，支持超过100种语言。通过多阶段训练范式和高质量数据训练，模型在MTEB排行榜上表现优异。Qwen3 Reranker可用于语义检索、文本分类、情感分析和代码搜索等场景，提升信息检索效率和准确性。

AI项目与工具 2025年06月11日 22 点赞 0 评论 575 浏览

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型，支持情感和语调的精确控制，通过内联音频标签实现多样化的表达。它支持多说话人对话，能模拟真实交谈中的语气变化，覆盖超70种语言，适用于媒体影视配音、有声读物制作、游戏开发和教育等领域，提供生动、真实的声音体验。

AI项目与工具 2025年06月11日 65 点赞 0 评论 592 浏览

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具，用户可通过上传目标语音音频并输入文本，快速生成克隆声音，无需训练语音网络。支持多语言及多种中文方言，提供经典版本和更新版本两种克隆选项，经典版使用Coqui TTS技术，更新版采用Coqui AI的XTTS工具，增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿，适用于内容创作、无障碍支持、语言学习和个性化数

AI项目与工具 2025年06月11日 47 点赞 0 评论 675 浏览

dots.llm1

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts（MoE）文本大模型，拥有 1420 亿参数，激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练，采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术，提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

AI项目与工具 2025年06月11日 78 点赞 0 评论 695 浏览

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型，能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言，处理复杂文档（如公式、表格）效果显著，处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集，模型在准确性和效率上表现优异，适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

AI项目与工具 2025年06月11日 15 点赞 0 评论 584 浏览

语言支持

首页

语言支持

列表

默认

浏览次数

发布日期