语音

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。

好会议

好会议是一个为高绩效销售和客户成功团队设计的基于人工智能的平台,旨在通过提供会议洞察和自动化工具来提升团队绩效。

DD星球

DD星球是一款基于AI技术的虚拟社交应用,用户可通过该平台创造并定制专属的AI伙伴,实现个性化的声音设置、实时语音交流以及数字宇宙的设计。此外,它还支持社交互动,帮助用户拓展社交圈,满足情感陪伴和娱乐休闲的需求。

Freed

Freed是一款基于AI技术的医疗文档助手,通过语音转录和自然语言处理技术,实现医患对话的自动化记录与结构化文档生成。其核心功能包括环境感知技术、个性化学习以及多语言支持,广泛适用于门诊、住院、急诊及远程医疗等多种医疗场景,旨在减轻医生文书负担,提升工作效率。

FaceHub

FaceHub是一款基于AI技术的照片和视频编辑工具,主要功能包括面部交换、AI肖像生成、动画制作及语音克隆等。它能够帮助用户轻松制作个性化内容,适用于社交媒体娱乐、个人创意表达以及专业用途如头像设计和视频配音。其强大的功能和简便的操作使其成为一款多功能的数字内容创作助手。

小乖记账

小乖记账是一款基于AI技术的智能记账应用,通过语音识别技术简化记账流程,自动分类财务数据,并提供直观的统计图表帮助用户分析消费习惯和资金流向。该应用还支持用户手动修改账单分类、设置虚拟形象陪伴记账过程、以及管理个人资产和负债。小乖记账适用于日常收支记录、预算管理、分类账目、资产管理、账单提醒、财务分析和家庭财务管理等多个应用场景。

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。

WowTo AI

WowTo是一个AI视频制作生成软件,使用AI创建和托管教程视频知识库。你可以用WowTo的视频编辑器制作支持视频、培训视频和教育视频。

Quin

Quin 是由知名思维导图产品Xmind推出的基于人类塔罗师语料库训练的AI 原生应用。与传统的塔罗牌应用不同,Quin 将 AI 的强大能力与古老的塔罗牌智慧相结合,将复杂的塔罗流程简化...

VXlive

VXlive是一款以语音社交为核心的多功能应用,支持语音聊天、直播、1对1视频通话及AI互动功能。内置AI语音识别与语音日记,提供个性化互动体验,增强用户情感陪伴。语音挑战活动提升社交趣味性,适合各类用户拓展社交圈,尤其适合社交焦虑人群。应用注重互动性和社区氛围,打造轻松友好的社交环境。