语音信号的增强方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26422460 阅读:66 留言:0更新日期:2020-11-20 14:18
本申请公开了一种语音信号的增强方法、装置、电子设备和存储介质,涉及语音技术领域、深度学习领域。具体实现方案为:获取麦克风信号、远端参考信号和声学回波消除信号;提取麦克风信号的麦克风特征,并提取远端参考信号的远端参考特征;根据麦克风特征和远端参考特征生成语音信号在预设多个频带之上的存在概率;根据在预设多个频带之上的存在概率对声学回波消除信号进行增强。本申请可以解决针对目前基于信号处理的回波消除技术面临的无法很好平衡回波消除量和近讲语音失真的问题。

【技术实现步骤摘要】
语音信号的增强方法、装置、电子设备和存储介质
本申请涉及计算机
,具体涉及语音
、深度学习领域,尤其涉及一种语音信号的增强方法、装置、电子设备和存储介质。
技术介绍
背景噪声和远端回波是影响语音通话体验的主要因素,经典的语音通讯系统中,这两个任务分别由噪声抑制(NoiseSuppression,英文简称:NS)和声学回波消除(AcousticEchoCancellation,英文简称:AEC)两个模块来完成。理想情况下,声学回波是可以通过一个线性自适应滤波器完全消除的,然而由于扬声器的非线性、信号截幅、不佳的腔体设计、线性滤波器长度不足以及传递函数变化等问题。实际应用时,单一的线性自适应滤波器并不能很好满足需求。这一点在手机、笔记本电脑等小型设备上尤为明显。因此,广泛应用的声学回波消系统除往往由线性自适应滤波器和残留回波抑制(ResidualEchoSuppression,英文简称:RES)器两部分组成。然而,相关技术中,基于信号处理的RES往往无法很好的平衡回波消除量和近讲语音失真。
技术实现思路
本申请提供了一种用于提高语音质量的语音信号的增强方法、装置、电子设备以及存储介质。根据本申请的一方面,提供了一种语音信号的增强方法,包括:获取麦克风信号、远端参考信号和声学回波消除信号;提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。根据本申请的第二方面,提供了一种语音信号的增强装置,包括:信号获取模块,用于获取麦克风信号、远端参考信号和声学回波消除信号;特征提取模块,用于提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;生成模块,用于根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;增强模块,用于根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。根据本申请的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述的语音信号的增强方法。根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行前述的语音信号的增强方法。根据本申请实施例的技术方案,通过提取麦克风信号的麦克风特征和远端参考信号的远端参考特征,并利用麦克风特征和远端参考特征生成语音信号在多个频带之上的存在概率,进而基于语音信号在多个频带之上的存在概率实现语音的增强,整个语音增强过程中,考虑了语音信号之中的麦克风信号,该麦克风信号不完全等于近端语音,该麦克风信号比较复杂,包含了近端语音、近端背景噪声等多路信号,是一个综合的信号,从而使得基于麦克风特征和远端参考特征对声学回波消除信号进行增强时,可以有效识别出近讲语音和回波信号,进而利用识别出的近讲语音和回波信号进行语音增强,可以解决针对目前基于信号处理的回波消除技术面临的无法很好平衡回波消除量和近讲语音失真的问题。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请一个实施例的语音信号的增强方法的流程图;图2是根据本申请另一个实施例的语音信号的增强方法的流程图;图3是根据本申请实施例的概率生成模型的训练流程图;图4是根据本申请实施例的语音信号的增强方法的流程图;图5是根据本申请实施例的概率生成模型在通讯系统的应用结构框图;图6为本申请的语音信号的增强方法的处理流程示例图;图7是本申请实施例选用的分带曲线的示例图;图8为本申请实施例的语音信号的波形与频谱图的示例图;图9为利用本申请实施例的增强方法处理后的结果示例图;图10是根据本申请一个实施例的语音信号的增强装置的结构框图;图11是根据本申请另一个实施例的语音信号的增强装置的结构框图;图12是根据本申请又一个实施例的语音信号的增强装置的结构框图;图13是用来实现本申请实施例的语音信号的增强方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,为了去除软截幅、扬声器非线性等因素引起的回波残留,目前常用的两种做法:一是引入非线性的自适应滤波器,二是增加RES的后处理模块。非线性自适应滤波器的经典模型有:沃尔泰拉滤波器、功率滤波器、基于饱和曲线的补偿器以及神经网络。尽管这些模型已经在部分场景下得到了成功的应用,但是由于大量的滤波器参数或者高阶统计量的计算导致模型较慢的收敛速度和较高的计算复杂度。大部分实际场景下均采用第二类增加RES后处理模块的方法,这类方法依赖于线性自适应网络,独立于背景噪声抑制模块。基于信号处理的一种常规RES方法会统计线性自适应网络的输出和传声器采集信号之间以及参考和传声器之间的相干性来计算得到一个反映所需进一步回波抑制的因子,线性自适应网络输出乘以这个因子。从而进一步抑制回波残留。RES后处理模块中计算回波抑制因子的方法主要有基于互相关的算法、中心削波算法、回波路径频域功率滤波算法等。但是,通常来说这些方法极具侵略性,可以较好的消除残余回波的同时也会引起近讲语音的失真。除去上述方法外,还有一些并未在实际产品中应用的基于深度学习的回波消除方法,但是这些深度学习的方法往往在仿真数据上进行,模型泛化能力和环境自适应能力不佳,模型规模往往也无法被目前的即时通讯系统所接受。如上所述,基于信号处理的回波残留抑制算法无法很好的平衡消除量和双讲近端语音失真,基于深度学习方法的泛化能力不佳,模型规模大无法实时运行在目前的即时通讯系统中。为此,本申请提出了一种语音信号的增强方法、装置、电子设备和存储介质,可以解决针对目前基于信号处理的回波消除技术面临的无法很好平衡回波消除量和近讲语音失真的问题。具体地,下面参考附图描述本专利技术实施例的语音信号的增强方法、装置、电子设备和存储介质。图1是根据本申请一个实施例的语音信号的增强方法的流程图。需要说明的是,本申请实施例的语音信号的增强方法应用于本申请实施例的语音信号的增强装置,该增强装置本文档来自技高网...

【技术保护点】
1.一种语音信号的增强方法,包括:/n获取麦克风信号、远端参考信号和声学回波消除信号;/n提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;/n根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;/n根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。/n

【技术特征摘要】
1.一种语音信号的增强方法,包括:
获取麦克风信号、远端参考信号和声学回波消除信号;
提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;
根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;
根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。


2.如权利要求1所述的语音信号的增强方法,其中,所述根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率,包括:
提取所述声学回波消除信号之中的声学回波消除特征;
将所述麦克风特征、所述远端参考特征和所述声学回波消除特征输入至概率生成模型,以生成所述语音信号在预设多个频带之上的存在概率。


3.如权利要求2所述的语音信号的增强方法,其中,所述概率生成模型包括卷积神经网络模块、循环神经网络模块和概率生成模块,其中,所述将所述麦克风特征、所述远端参考特征和所述声学回波消除特征输入至概率生成模型,以生成所述语音信号在预设多个频带之上的存在概率,包括:
所述卷积神经网络模块根据所述麦克风特征、所述远端参考特征和所述声学回波消除特征生成特征时序信息;
所述循环神经网络模块根据所述特征时序信息生成所述多个频带的频带特征以及频带间的关系特征;
所述概率生成模块根据所述频带特征和所述频带间的关系特征生成所述语音信号在预设多个频带之上的存在概率。


4.如权利要求3所述的语音信号的增强方法,其中,所述概率生成模型通过以下步骤训练获得:
获取近端样本无噪声语音信号和近端样本噪声信号;
获取远端回波信号;
根据所述近端样本无噪声语音信号、所述近端样本噪声信号和所述远端回波信号生成麦克风样本信号;
获取远端样本参考信号;
根据所述远端样本参考信号和所述麦克风样本信号生成样本声学回波消除信号;
将所述麦克风样本信号、所述远端样本参考信号和所述样本声学回波消除信号输入至所述概率生成模型以生成预测概率;
根据所述近端样本无噪声语音信号和所述样本声学回波消除信号生成目标概率;以及
根据所述预测概率和所述目标概率生成损失值,并根据所述损失值对所述概率生成模型进行训练。


5.如权利要求1所述的语音信号的增强方法,其中,所述提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征,包括:
对所述麦克风信号进行频域转换以生成麦克风频域信号,并对所述远端参考信号进行频域转换以生成远端参考频域信号;
按照所述预设的多个频带对所述麦克风频域信号进行频域合并以生成所述麦克风特征;
按照所述预设的多个频带对所述远端参考频域信号进行频域合并以生成所述远端参考特征。


6.如权利要求1所述的语音信号的增强方法,其中,所述根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强,包括:
对所述声学回波消除信号进行频域转换以生成声学回波消除频域信号;
根据所述声学回波消除频域信号生成相位特征;
按照所述预设的多个频带对所述声学回波消除频域信号进行频域合并以生成声学回波消除特征;
根据所述相位特征、所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强。


7.如权利要求6所述的语音信号的增强方法,其中,所述根据所述相位特征、所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强,包括:
根据所述声学回波消除特征和所述在预设多个频带之上的存在概率进行增强生成增强声学回波消除频带信号;
根据所述预设的多个频带对所述增强声学回波消除频带信号进行频带展开以生成增强声学回波消除频域信号;
根据所述增强声学回波消除频域信号和所述相位特征生成增强信号。


8.一种语音信号的增强装置,包括:
信号获取模块,用于获取麦克风信号、远端参考信号和声学回波消除信号...

【专利技术属性】
技术研发人员:张国昌魏建强于利标韩润强卿睿李峥
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1