【技术实现步骤摘要】
本专利技术涉及语音增强,尤其涉及一种融合声码器和相位估计的语音增强方法和系统。
技术介绍
1、在日常生活中,语音是人们接触最多同时也是使用频率最高的信息之一。因为环境嘈杂或受网络传输过程中的各种因素所影响,语音信号不可避免地会带有噪声,如身处道路时汽车的喇叭声或传输过程中因为网络信号问题所造成的电流声。随着智能网络与信息传递的快速发展,ai技术在人们生活便利化过程中的不断渗透,语音信息传递的准确性对人类日常生活的重要性越来越大,语音增强模型的优化与提升也越来越重要。
2、语音增强技术旨在通过各种算法来改善语音质量;通过降噪来提高被噪声破坏的语音,即噪声降低,是语音增强中最重要的领域。根据语音信号的通道数量,可分为单通道与多通道两个研究方向,其中单通道语音增强作为其他研究的基础,是尤其重要的一环。
3、传统语音增强架构主要基于傅里叶变换的应用,时域下的语音波形经过傅里叶变换后生成为时频域下的幅度谱与相位谱,处理后再通过逆傅里叶变换重新恢复成增强后的语音波形。随着数字信号处理理论的不断完善,其已成为传统语音增强模型的
...【技术保护点】
1.一种融合声码器和相位估计的语音增强方法,其特征在于,至少包括如下步骤:
2.根据权利要求1所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S2中,相位增强单元至少设置相位降噪模块,相位降噪模块采用神经网络实现。
3.根据权利要求2所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S2还包括如下步骤:
4.根据权利要求3所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S21包括:
5.根据权利要求4所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S213中,训练过程所采用的损失函数
...
【技术特征摘要】
1.一种融合声码器和相位估计的语音增强方法,其特征在于,至少包括如下步骤:
2.根据权利要求1所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s2中,相位增强单元至少设置相位降噪模块,相位降噪模块采用神经网络实现。
3.根据权利要求2所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s2还包括如下步骤:
4.根据权利要求3所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s21包括:
5.根据权利要求4所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s213中,训练过程所采用的损失函数如下式:
6.根据权利要求5所述的融合声码器和相位估计的语音增强方法,其特征在于,步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。