深度学习
Video Diffusion Models
Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。
PaddleSpeech
PaddleSpeech是百度飞桨团队开发的开源语音处理工具,涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式,适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架,提供高效的深度学习模型和丰富的音频处理能力,适用于多种实际应用需求。
Sketch2Lineart
Sketch2Lineart是一款利用人工智能技术将手绘草图转换为清晰线条画的工具。它具备草图转线稿、自动描述生成、细节调整、风格定制及实时预览等功能。通过深度学习和神经网络,该工具能够准确提取草图特征并生成高质量的艺术线条画,适用于艺术创作、产品设计、教育培训及社交媒体内容创作等多个领域。
