一种融合声码器和相位估计的语音增强方法和系统技术方案

技术编号:41114821 阅读:17 留言:0更新日期:2024-04-25 14:05
本发明专利技术公开了一种融合声码器和相位估计的语音增强方法和系统,至少包括如下步骤:步骤S1:构建、训练声码器增强单元,用于对输入的带噪语音进行处理,输出增强语音信息;步骤S2:构建、训练相位增强单元,用于对输入的带噪语音进行处理,输出增强相位信息;步骤S3:构建后处理模块,用于接收步骤S2获取的增强相位信息和步骤S1获取的增强语音信息并进行融合处理,以得到降噪后的语音信号。本发明专利技术采用融合声码器和相位估计的语音增强联合架构,提升了语音增强模型生成模型的质量;另外,采用的相位解码器和抗卷绕相位损失函数解决了相位处理的关键难题,有效提高了语音增强技术在低信噪比场景下的表现。

【技术实现步骤摘要】

本专利技术涉及语音增强,尤其涉及一种融合声码器和相位估计的语音增强方法和系统


技术介绍

1、在日常生活中,语音是人们接触最多同时也是使用频率最高的信息之一。因为环境嘈杂或受网络传输过程中的各种因素所影响,语音信号不可避免地会带有噪声,如身处道路时汽车的喇叭声或传输过程中因为网络信号问题所造成的电流声。随着智能网络与信息传递的快速发展,ai技术在人们生活便利化过程中的不断渗透,语音信息传递的准确性对人类日常生活的重要性越来越大,语音增强模型的优化与提升也越来越重要。

2、语音增强技术旨在通过各种算法来改善语音质量;通过降噪来提高被噪声破坏的语音,即噪声降低,是语音增强中最重要的领域。根据语音信号的通道数量,可分为单通道与多通道两个研究方向,其中单通道语音增强作为其他研究的基础,是尤其重要的一环。

3、传统语音增强架构主要基于傅里叶变换的应用,时域下的语音波形经过傅里叶变换后生成为时频域下的幅度谱与相位谱,处理后再通过逆傅里叶变换重新恢复成增强后的语音波形。随着数字信号处理理论的不断完善,其已成为传统语音增强模型的有效助力,并衍生出了本文档来自技高网...

【技术保护点】

1.一种融合声码器和相位估计的语音增强方法,其特征在于,至少包括如下步骤:

2.根据权利要求1所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S2中,相位增强单元至少设置相位降噪模块,相位降噪模块采用神经网络实现。

3.根据权利要求2所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S2还包括如下步骤:

4.根据权利要求3所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S21包括:

5.根据权利要求4所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤S213中,训练过程所采用的损失函数如下式:

...

【技术特征摘要】

1.一种融合声码器和相位估计的语音增强方法,其特征在于,至少包括如下步骤:

2.根据权利要求1所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s2中,相位增强单元至少设置相位降噪模块,相位降噪模块采用神经网络实现。

3.根据权利要求2所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s2还包括如下步骤:

4.根据权利要求3所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s21包括:

5.根据权利要求4所述的融合声码器和相位估计的语音增强方法,其特征在于,步骤s213中,训练过程所采用的损失函数如下式:

6.根据权利要求5所述的融合声码器和相位估计的语音增强方法,其特征在于,步...

【专利技术属性】
技术研发人员:江文斌蔡轩昊魏婕
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1