一种语音信号处理方法、装置、设备以及存储介质制造方法及图纸

技术编号：26224679 阅读：44 留言：0更新日期：2020-11-04 10:59

本申请公开了一种语音信号处理方法、装置、设备以及存储介质，涉及自然语言处理、深度学习和语音交互技术领域。具体实现方案为：对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；根据所述至少两路语音信号，确定目标声源的掩码；根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号。以高质量从多个声源的原始语音信号中提取出目标声源的语音信号。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音信号处理方法、装置、设备以及存储介质
本申请涉及信号处理
，尤其自然语言处理、深度学习和语音交互技术，具体涉及一种语音信号处理方法、装置、设备以及存储介质。
技术介绍
在语音交互场景中，多声源(例如多人说话，或者人声和非人声等)场景十分常见，例如智能家居语音交互场景和车载语音交互场景等。如何从多个声源的原始语音信号中提取目标声源的语音信号十分重要，因此亟需一种能够很好提取出目标声源的语音信号的方法。
技术实现思路
本公开实施例提供了一种语音信号处理方法、装置、设备以及存储介质，以高质量从多个声源的原始语音信号中提取出目标声源的语音信号。根据本公开的一方面，提供了一种语音信号处理方法，该方法包括：对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；根据所述至少两路语音信号，确定目标声源的掩码；根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号。根据本公开的另一方面，提供了一种语音信号处理装置，该装置包括：波束形成模块，用于对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；掩码确定模块，用于根据所述至少两路语音信号，确定目标声源的掩码；目标信号确定模块，用于根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号。根据本公开的另一方面，提供了一种电子设备，该电子设备包括：至少一个处理器；以及与所述至少一个处...

【技术保护点】
1.一种语音信号处理方法，包括：/n对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；/n根据所述至少两路语音信号，确定目标声源的掩码；/n根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号。/n

【技术特征摘要】
1.一种语音信号处理方法，包括：
对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；
根据所述至少两路语音信号，确定目标声源的掩码；
根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号。

2.根据权利要求1所述的方法，其中，对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号，包括：
采用神经网络波束，对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行处理，得到至少两路语音信号。

3.根据权利要求1所述的方法，其中，根据所述至少两路语音信号，确定目标声源的掩码，包括：
对所述至少两路语音信号进行特征域变换，并从所述特征域中提取至少两个候选声源的语音信号特征；
采用复数掩码生成器对所提取的所述至少两个候选声源的语音信号特征进行融合和排序处理，得到目标声源的复数掩码。

4.根据权利要求3所述的方法，其中，从所述特征域中提取至少两个候选声源的语音信号特征，包括：
确定所述至少两路语音信号之间的差异特征；所述差异特征包括幅度特征和相位特征；
根据所述差异特征，从所述特征域中提取至少两个候选声源的语音信号特征。

5.根据权利要求1-4任一所述的方法，其中，根据所述目标声源的掩码和所述原始语音信号，得到目标声源的语音信号，包括：
根据所述目标声源的掩码和所述原始语音信号的特征，得到目标声源特征；
根据所述目标声源特征，得到所述目标声源的语音信号。

6.根据权利要求1所述的方法，还包括：
根据所述目标声源的语音信号和声源场景信息，确定对终端的控制指令。

7.一种语音信号处理装置，包括：
波束形成模块，用于对麦克风阵列所采集到的至少两个候选声源的原始语音信号进行波束形成，得到至少两路语音信号；
掩码确定模块，用于根据所述至少两路语音信号，确定目...

【专利技术属性】
技术研发人员：吴晓潭，贡昱洲，罗友，李峥，魏建强，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人