R
VoiceCraft
VoiceCraft是一款开源的神经编解码器语言模型,专攻零样本语音编辑和文本到语音(TTS)任务。它采用Transformer架构,通过token重排过程结合因果掩蔽和延迟叠加技术,实现在现有音频序列内高效生成自然的语音。VoiceCraft在多种口音、风格和噪声条件下表现出色,适用于有声读物制作、视频内容创作、播客音频编辑及多语言内容生产等场景。
boardmix博思白板-优惠券
boardmix博思白板是一款基于云端的在线思维导图软件,内置AI助手功能,能根据输入的主题自动生成思维导图内容。它支持团队协作,无文件和节点限制,并且免费使用。
Whisper语音识别模型
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
screenpipe
ScreenPipe是一款基于AI技术的开源软件,具备全天候屏幕和音频记录功能,能够智能生成每日工作摘要、会议纪要,并监控安全风险。它支持本地处理,确保数据安全,同时提供插件系统以满足个性化需求。ScreenPipe适用于个人效率提升、企业自动化、安全监控、内容创作、教育培训及客户服务等多个场景。