语音增强方法、电子设备和存储介质技术

技术编号：29079152 阅读：33 留言：0更新日期：2021-06-30 09:38

本申请提出了一种语音增强方法、电子设备和存储介质，涉及语音处理技术领域。其中，上述语音增强方法包括：首先，获取到麦克风阵列采集的语音信号。然后，根据各个声区的声区参数，分别对语音信号进行预增强，得到各个声区分别对应的预增强语音信号。其次，从各个预增强语音信号中确定包含唤醒词的目标语音信号。将目标语音信号对应的声区确定为产生语音信号的声源所在的目标声区。最后，在目标声区对产生语音信号的声源进行定位，并根据声源的定位信息对语音信号进行定向增强。通过在唤醒阶段使用声区预增强后的语音信号，可提升唤醒性能。从而，可在多个声源干扰的情况下，准确定位目标声源的位置，并提高识别阶段语音增强性能。并提高识别阶段语音增强性能。并提高识别阶段语音增强性能。

全部详细技术资料下载

【技术实现步骤摘要】
语音增强方法、电子设备和存储介质

[0001]本申请涉及语音处理
，尤其涉及一种语音增强方法、电子设备和存储介质。

技术介绍

[0002]在一些涉及语音交互的场景中，如智能音箱、智能汽车以及智能机器人等，通常需要先对用户输入的语音信号进行语音信号处理。语音信号处理主要包括确定目标声源的来波方向，以及利用波束形成技术对来波方向上的语音信号进行波束增强，从而达到增强有效信号、抑制噪声和干扰的目的。
[0003]目前，在确定目标声源的来波方向时，主要是通过波达方向估计技术实现目标声源定位。但是，当环境中存在多个声源干扰时，目前的技术无法准确定位目标声源所在方向，导致语音增强过程中生成的波束发散，影响后续的语音交互服务。

技术实现思路

[0004]本申请实施例提供了一种语音增强方法、电子设备和存储介质，以实现在多个声源干扰的情况下，准确定位目标声源的位置，提高唤醒与识别阶段语音增强性能。
[0005]第一方面，本申请实施例提供一种语音增强方法，所述方法包括：获取到麦克风阵列采集的语音信号；根据各个声区的声区参数，分别对所述语音信号进行预增强，得到所述各个声区分别对应的预增强语音信号；其中，所述各个声区是根据所述麦克风阵列包含的各个麦克风的方位信息预先划分的；从各个所述预增强语音信号中确定包含唤醒词的目标语音信号；将所述目标语音信号对应的声区确定为产生所述语音信号的声源所在的目标声区；在所述目标声区对产生所述语音信号的声源进行定位，并根据所述声源的定位信息对所述语音信号进行定向...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法，其特征在于，包括：获取到麦克风阵列采集的语音信号；根据各个声区的声区参数，分别对所述语音信号进行预增强，得到所述各个声区分别对应的预增强语音信号；其中，所述各个声区是根据所述麦克风阵列包含的各个麦克风的方位信息预先划分的；从各个所述预增强语音信号中确定包含唤醒词的目标语音信号；将所述目标语音信号对应的声区确定为产生所述语音信号的声源所在的目标声区；在所述目标声区对产生所述语音信号的声源进行定位，并根据所述声源的定位信息对所述语音信号进行定向增强。2.根据权利要求1所述的方法，其特征在于，麦克风的方位信息包括：麦克风在所述麦克风阵列中的相对位置参数；根据所述麦克风阵列包含的各个麦克风的方位信息预先划分所述各个声区，包括：根据所述麦克风阵列包含的各个麦克风在所述麦克风阵列中的相对位置参数，将所述麦克风阵列的信号采集区域划分为多个声区，并且根据所述声区的中心线位置，确定所述声区的声区参数。3.根据权利要求1所述的方法，其特征在于，从各个所述预增强语音信号中确定包含唤醒词的目标语音信号，包括：利用神经网络模型，对各个所述预增强语音信号的信号特征与预设信号特征的相似度进行打分；其中，所述预设信号特征是唤醒词对应的唤醒语音信号的信号特征；根据打分结果确定目标语音信号。4.根据权利要求3所述的方法，其特征在于，根据打分结果确定目标语音信号，包括：将各个所述预增强语音信号中分值高于预设阈值且分值最高的预增强语音信号确定为目标语音信号。5.根据权利要求4所述的方法，其特征在于，如果各个所述预增强语音信号的分值均低于所述预设阈值，则所述方法还包括：通过所述麦克风阵列获取新的语音信号，直至生成的各个预增强语音信号中至少一个预增强...

【专利技术属性】
技术研发人员：夏洁，方思敏，罗丽云，李开，
申请(专利权)人：锐迪科微电子上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人