语音 - 智狐AI导航

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 704 浏览

Vozard

一款由iMobie开发的AI驱动的实时语音变声软件，提供超过100种逼真的语音效果。用户可以在在线聊天、游戏等场景中使用。

Ai语音工具 2025年06月05日 94 点赞 0 评论 704 浏览

DeepL

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务，可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Ai语音工具 2026年06月22日 0 点赞 0 评论 703 浏览

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器，可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率，并有一个强大的声音工作室，以合并和增强...

Ai语音工具 2026年06月22日 0 点赞 0 评论 702 浏览

OCTAVE

OCTAVE是一款由Hume AI研发的语音语言处理工具，融合了多种领先AI技术，具备强大的个性化语音生成能力，支持从文字到语音的即时转化，并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应，以及实时语音处理等。此外，OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域，为用户带来更加自然、生动的交互体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 701 浏览

妙话AI

一个在线智能写作应用，妙话AI提供了包括自动生成绘画、语音对话机器人等多种功能。它集成了100多个智能AI大模型，用户可以通过一键操作进行聊天、写作、绘画和语音生成，轻松解决复杂问题。

AI写作对话 2025年06月05日 80 点赞 0 评论 701 浏览

VideoCaptioner

VideoCaptioner是一款基于大语言模型的智能字幕处理工具，支持语音识别、字幕优化、翻译、样式调整及视频合成等功能。无需GPU即可运行，兼容多语言和多种字幕格式，适用于视频创作者、教育工作者及字幕翻译团队，提升字幕制作效率与质量。

AI项目与工具 2025年06月12日 50 点赞 0 评论 700 浏览

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别（ASR）模型，采用 FastConformer 和 TDT 架构，具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异，实时因子高达 3386，适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

AI项目与工具 2025年06月11日 36 点赞 0 评论 700 浏览

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型（DiT）的实时视频聊天工具，可将图片转化为可互动的动画角色，支持多语言和实时对话。通过优化模型提升流畅度与响应速度，适用于娱乐、教育、营销等多种场景，结合语音识别、文本生成等技术，提供完整的交互体验。

AI项目与工具 2025年06月11日 61 点赞 0 评论 699 浏览

Glimmer AI

一款使用GPT-3和DALL·E 2进行AI支持的ppt演示工具，根据用户的文本和语音指令生成视觉非常出色的PPT演示文稿。

PPT资源 2025年06月05日 96 点赞 0 评论 699 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期

Ola