语音信号的增强方法、装置、电子设备和存储介质制造方法及图纸

技术编号：26422460 阅读：66 留言：0更新日期：2020-11-20 14:18

本申请公开了一种语音信号的增强方法、装置、电子设备和存储介质，涉及语音技术领域、深度学习领域。具体实现方案为：获取麦克风信号、远端参考信号和声学回波消除信号；提取麦克风信号的麦克风特征，并提取远端参考信号的远端参考特征；根据麦克风特征和远端参考特征生成语音信号在预设多个频带之上的存在概率；根据在预设多个频带之上的存在概率对声学回波消除信号进行增强。本申请可以解决针对目前基于信号处理的回波消除技术面临的无法很好平衡回波消除量和近讲语音失真的问题。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号的增强方法、装置、电子设备和存储介质
本申请涉及计算机
，具体涉及语音
、深度学习领域，尤其涉及一种语音信号的增强方法、装置、电子设备和存储介质。
技术介绍
背景噪声和远端回波是影响语音通话体验的主要因素，经典的语音通讯系统中，这两个任务分别由噪声抑制(NoiseSuppression，英文简称：NS)和声学回波消除(AcousticEchoCancellation，英文简称：AEC)两个模块来完成。理想情况下，声学回波是可以通过一个线性自适应滤波器完全消除的，然而由于扬声器的非线性、信号截幅、不佳的腔体设计、线性滤波器长度不足以及传递函数变化等问题。实际应用时，单一的线性自适应滤波器并不能很好满足需求。这一点在手机、笔记本电脑等小型设备上尤为明显。因此，广泛应用的声学回波消系统除往往由线性自适应滤波器和残留回波抑制(ResidualEchoSuppression，英文简称：RES)器两部分组成。然而，相关技术中，基于信号处理的RES往往无法很好的平衡回波消除量和近讲语音失真。
技术实现思路
本申请提供了一种用于提高语音质量的语音信号的增强方法、装置、电子设备以及存储介质。根据本申请的一方面，提供了一种语音信号的增强方法，包括：获取麦克风信号、远端参考信号和声学回波消除信号；提取所述麦克风信号的麦克风特征，并提取所述远端参考信号的远端参考特征；根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率；根据所述在...

【技术保护点】
1.一种语音信号的增强方法，包括：/n获取麦克风信号、远端参考信号和声学回波消除信号；/n提取所述麦克风信号的麦克风特征，并提取所述远端参考信号的远端参考特征；/n根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率；/n根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。/n

【技术特征摘要】
1.一种语音信号的增强方法，包括：
获取麦克风信号、远端参考信号和声学回波消除信号；
提取所述麦克风信号的麦克风特征，并提取所述远端参考信号的远端参考特征；
根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率；
根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。

2.如权利要求1所述的语音信号的增强方法，其中，所述根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率，包括：
提取所述声学回波消除信号之中的声学回波消除特征；
将所述麦克风特征、所述远端参考特征和所述声学回波消除特征输入至概率生成模型，以生成所述语音信号在预设多个频带之上的存在概率。

3.如权利要求2所述的语音信号的增强方法，其中，所述概率生成模型包括卷积神经网络模块、循环神经网络模块和概率生成模块，其中，所述将所述麦克风特征、所述远端参考特征和所述声学回波消除特征输入至概率生成模型，以生成所述语音信号在预设多个频带之上的存在概率，包括：
所述卷积神经网络模块根据所述麦克风特征、所述远端参考特征和所述声学回波消除特征生成特征时序信息；
所述循环神经网络模块根据所述特征时序信息生成所述多个频带的频带特征以及频带间的关系特征；
所述概率生成模块根据所述频带特征和所述频带间的关系特征生成所述语音信号在预设多个频带之上的存在概率。

4.如权利要求3所述的语音信号的增强方法，其中，所述概率生成模型通过以下步骤训练获得：
获取近端样本无噪声语音信号和近端样本噪声信号；
获取远端回波信号；
根据所述近端样本无噪声语音信号、所述近端样本噪声信号和所述远端回波信号生成麦克风样本信号；
获取远端样本参考信号；
根据所述远端样本参考信号和所述麦克风样本信号生成样本声学回波消除信号；
将所述麦克风样本信号、所述远端样本参考信号和所述样本声学回波消除信号输入至所述概率生成模型以生成预测概率；
根据所述近端样本无噪声语音信号和所述样本声学回波消除信号生成目标概率；以及
根据所述预测概率和所述目标概率生成损失值，并根据所述损失值对所述概率生成模型进行训练。

5.如权利要求1所述的语音信号的增强方法，其中，所述提取所述麦克风信号的麦克风特征，并提取所述远端参考信号的远端参考特征，包括：
对所述麦克风信号进行频域转换以生成麦克风频域信号，并对所述远端参考信号进行频域转换以生成远端参考频域信号；
按照所述预设的多个频带对所述麦克风频域信号进行频域合并以生成所述麦克风特征；
按照所述预设的多个频带对所述远端参考频域信号进行频域合并以生成所述远端参考特征。

6.如权利要求1所述的语音信号的增强方法，其中，所述根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强，包括：
对所述声学回波消除信号进行频域转换以生成声学回波消除频域信号；
根据所述声学回波消除频域信号生成相位特征；
按照所述预设的多个频带对所述声学回波消除频域信号进行频域合并以生成声学回波消除特征；
根据所述相位特征、所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强。

7.如权利要求6所述的语音信号的增强方法，其中，所述根据所述相位特征、所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强，包括：
根据所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强生成增强声学回波消除频带信号；
根据所述预设的多个频带对所述增强声学回波消除频带信号进行频带展开以生成增强声学回波消除频域信号；
根据所述增强声学回波消除频域信号和所述相位特征生成增强信号。

8.一种语音信号的增强装置，包括：
信号获取模块，用于获取麦克风信号、远端参考信号和声学回波消除信号...

【专利技术属性】
技术研发人员：张国昌，魏建强，于利标，韩润强，卿睿，李峥，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人