语音 - 智狐AI导航

小虫快读

小虫快读（BugQR）是一款集成OCR技术和AI大语言模型的高效阅读工具，支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式（Summary、Explain、Note）满足多样化阅读需求，适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能，高级版本支持内容导出。

AI项目与工具 2025年06月12日 24 点赞 0 评论 806 浏览

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型，能够处理文本和语音数据，支持跨模态学习。其基础版（BASE）和表达版（EXPRESSIVE）分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别（ASR）、文本到语音（TTS）、语音分类及情感分析等任务，在语音助手、语音转写、有声读物等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 806 浏览

backseat ai

Backseat AI是一款面向《英雄联盟》玩家的AI语音辅助工具，提供实时游戏评论、购买建议、对线策略以及赛后分析等功能。它具有低资源占用、多语言支持和个性化语音包的特点，并与创作者共享收益，支持内容创作发展。

AI项目与工具 2025年06月12日 48 点赞 0 评论 805 浏览

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架，基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器，提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色，具备高稳定性与自然连贯性，支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 804 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 804 浏览

星声AI

星声AI是一款智能化播客生成工具，支持文字、网页链接或文档输入，自动生成结构完整的播客脚本，并通过高质量语音合成技术转化为自然流畅的音频内容。平台支持中、英、日、韩四国语言，提供多种音色与风格选择，具备音频编辑、内容拆解、多平台发布等功能，适用于知识分享、企业培训、内容创作等多种场景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 804 浏览

Quin

Quin 是由知名思维导图产品Xmind推出的基于人类塔罗师语料库训练的AI 原生应用。与传统的塔罗牌应用不同，Quin 将 AI 的强大能力与古老的塔罗牌智慧相结合，将复杂的塔罗流程简化...

Ai科技公司 2026年06月21日 0 点赞 0 评论 802 浏览

Illuminate

Illuminate是一款基于谷歌Gemini语言模型开发的AI工具，可将学术论文转化为生动的音频讨论。它通过自然语言处理技术和文本到语音合成，生成包含核心观点的对话内容，支持用户在碎片化时间中高效学习。该工具具备动态音频转换、个性化学习体验、互动反馈及多平台共享等功能，适用于学术研究、学生辅助学习及非专业人士的知识普及。

AI项目与工具 2025年06月12日 29 点赞 0 评论 802 浏览

uTools

一个多功能、现代化的效率工具平台，uTools 提供了多样化的功能，满足你不同的需求，成为一款功能强大的个人效率助理。

独立开发 2025年06月05日 85 点赞 0 评论 801 浏览

知意配音

知意配音是一款利用AI技术的文字转语音工具，支持多平台操作，拥有超过200种声音选项，可满足多种配音需求。它具备多音字识别、文案提取、视频字幕编辑等功能，适用于小说推文、影视解说、广告制作等多个领域，是自媒体创作者和视频制作者的理想助手。

AI项目与工具 2025年06月12日 38 点赞 0 评论 801 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期