语音 - 智狐AI导航

SpeechEasy

SpeechEasy是一种合成语音解决方案，可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台，支持桌面和移动设备，有近12种高质量的合成声音可供选择。它使用简单...

Ai语音工具 2026年06月22日 0 点赞 0 评论 698 浏览

DeepL-translator

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务，可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Ai语音工具 2026年06月22日 0 点赞 0 评论 698 浏览

Grimo

Grimo 是一款集成多种 AI 技术的写作辅助工具，支持语音输入、提示管理、实时网络搜索和团队协作等功能，适用于作家、内容创作者及专业人员。其提供多个版本以满足不同需求，具备高度定制化和智能化特性，有效提升写作效率和内容质量。

AI项目与工具 2025年06月11日 10 点赞 0 评论 698 浏览

Soundverse AI

一个利用生成式人工智能的音乐创作平台，Soundverse AI提供免费的 AI 音乐生成器和语音助手，帮助音乐创作者轻松制作高质量的音乐。

Ai语音工具 2025年06月05日 80 点赞 0 评论 698 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 697 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 697 浏览

Rask.ai

Rask.ai平台以其自动化和智能化的翻译及配音服务，帮助企业节省时间和成本，同时提高内容的全球可访问性。

创作工具 2026年06月22日 0 点赞 0 评论 697 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 697 浏览

SlideSpeak

SlideSpeak是一款基于AI技术的多功能工具，支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外，SlideSpeak强调数据安全性，适用于学术研究、商业演示、教育培训等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 696 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 696 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期