语音 - 智狐AI导航

easegen

Easegen 是一款开源的 AI 工具，支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音，并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆，旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等，适用于在线教育、企业培训、学术研究、语言学习及职业培训

AI项目与工具 2025年06月12日 45 点赞 0 评论 565 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 565 浏览

场辞

场辞,AI视频字幕制作软件，一款基于语音识别技术的视频字幕制作软件，一键智能识别字幕，提供语音转字幕、一键加字幕、视频加字幕，字幕快捷校对等功能，用AI加速你的创作。

Ai语音工具 2025年06月05日 87 点赞 0 评论 564 浏览

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口，具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动，并支持会话记忆和外部功能调用，广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 563 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 562 浏览

寒武纪

打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

创作工具 2026年06月21日 0 点赞 0 评论 562 浏览

音品汇配音

为用户提供文字转语音在线转化服务，文字转语音准确率达99%

字幕配音 2025年06月05日 61 点赞 0 评论 562 浏览

Arctime

简单、强大、高效的跨平台字幕制作软件

字幕配音 2025年06月05日 34 点赞 0 评论 561 浏览

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件，Memo都能轻松将其转换为文本并提炼精华。

Ai语音工具 2026年06月21日 0 点赞 0 评论 561 浏览

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型（MLLM）。它通过整合视觉、语音和文本三种模态的信息，实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据，还支持流式文本-语音生成及跨模态信息交互，适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 560 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期