多语言支持

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 488 浏览

悟道·天鹰（Aquila）

悟道·天鹰（Aquila）是智源研究院开源的中英双语语言大模型，具备强大的语言理解和生成能力。模型在设计上注重商用和数据合规性，同时提供持续的开源更新和技术支持。

Ai平台模型 2026年06月21日 0 点赞 0 评论 489 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 489 浏览

BING翻译

输入网址则可启动网页全翻译功能

Ai语音工具 2026年06月21日 0 点赞 0 评论 490 浏览

Nooka

Nooka是一款基于AI技术的听书应用，提供全球非虚构类书籍的20分钟音频摘要，适合碎片化时间学习。用户可随时提问并获得AI即时回答，实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流，适用于通勤、运动、家务等多种场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 490 浏览

Mistral Small 3.1

Mistral Small 3.1 是一款由 Mistral AI 开发的开源多模态 AI 模型，拥有 240 亿参数，支持文本与图像处理，具备长达 128k tokens 的上下文窗口和每秒 150 token 的推理速度。采用 Transformer 架构与 MoE 技术，提升计算效率，支持多语言和本地部署。适用于文档处理、图像分析、质量检测、虚拟助手等多种场景。

AI项目与工具 2025年06月12日 58 点赞 0 评论 490 浏览