语音

AdamCAD

只需通过用简单的语言描述就能为你生成复杂的CAD图纸,而且还能通过3D打印机直接打印出来,适用于工业设计和机械工程行业。

Skyo

Skyo是一款基于天工AI大模型技术的智能语音对话助手,具备快速响应、多语言对话、实时打断、情感化回应及个性化记忆等功能。它能根据用户情绪提供拟人化回复,并支持长时间对话和个性化声音定制。Skyo可应用于情感陪伴、个性化交互、多语言客服、时事新闻聊天、教育辅助和生活助理等多个场景,旨在为用户提供高质量的互动体验。

Emote

Emote是一款基于AI技术的智能笔记工具,支持实时语音转录、情感分析及关键词提取等功能。它能帮助用户记录生活、管理时间、分析消费习惯,并提供私人笔友服务以实现情感支持。同时,Emote允许用户自定义笔记本和标签,满足个性化需求。

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜,木言AI是新自媒体人必不可少的工具!

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。

WorkOnGPT

一站式AI办公平台,集成多种AI模型,提供免费的ChatGPT等AI模型服务,涵盖ChatGPT,文档翻译、问答互动、语言转文字等功能,适合各类办公需求,助力为您实现高效办公。

OpenL

OpenL 是一个功能强大的 AI 驱动翻译工具,它利用最新的人工智能技术为用户提供快速、准确的翻译服务。