语音 - 智狐AI导航

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型，专注于将美国手语（ASL）实时翻译成英语文本。通过多模态训练方法，结合视觉和文本数据，实现高准确率和低延迟的翻译，响应时间低于0.5秒。支持端侧部署，保护用户隐私，适用于教育、医疗和公共服务等场景。

AI项目与工具 2025年06月11日 24 点赞 0 评论 716 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 717 浏览

VXlive

VXlive是一款以语音社交为核心的多功能应用，支持语音聊天、直播、1对1视频通话及AI互动功能。内置AI语音识别与语音日记，提供个性化互动体验，增强用户情感陪伴。语音挑战活动提升社交趣味性，适合各类用户拓展社交圈，尤其适合社交焦虑人群。应用注重互动性和社区氛围，打造轻松友好的社交环境。

AI项目与工具 2025年06月12日 78 点赞 0 评论 718 浏览

kokoroTTS

一款开源、高性能的文本转语音（TTS）模型，Kokoro TTS拥有8200万参数，基于StyleTTS 2架构，提供高质量、自然的语音合成，适用于有声书、播客等。

Ai语音工具 2025年06月05日 80 点赞 0 评论 718 浏览

VoiceCraft

VoiceCraft是一款开源的神经编解码器语言模型，专攻零样本语音编辑和文本到语音（TTS）任务。它采用Transformer架构，通过token重排过程结合因果掩蔽和延迟叠加技术，实现在现有音频序列内高效生成自然的语音。VoiceCraft在多种口音、风格和噪声条件下表现出色，适用于有声读物制作、视频内容创作、播客音频编辑及多语言内容生产等场景。

AI项目与工具 2024年01月01日 31 点赞 0 评论 718 浏览

Dola

Dola是一款基于人工智能的日历助手，它允许用户通过多种方式（包括文字、语音和图片）与主要的即时通讯软件交互，以高效地创建和管理日程事件。Dola具备自然语言理解和日历同步功能，能够自动识别并添加日程，支持跨平台同步，并在事件开始前发送提醒。此外，它还提供群组管理功能，适合团队和组织使用。Dola简化了日程管理流程，提升了个人和团队的工作效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 719 浏览

蓝藻AI

运用了尖端的创造性人工智能技术，致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。

创作工具 2026年06月22日 0 点赞 0 评论 719 浏览

晓象AI

通过与博主合作，复制博主的AI分身，通过模拟知识博主的声音、风格和表达方式，为每个粉丝提供量身定制的回答。

Ai办公效率 2025年06月05日 14 点赞 0 评论 720 浏览

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术，帮助用户基于语音转文字的结果，选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面，以及支持多段剪辑和自动生成SRT字幕文件。

AI项目与工具 2024年07月01日 55 点赞 0 评论 720 浏览

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 721 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期