波束形成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34184561 阅读:61 留言:0更新日期:2022-07-17 13:54
本发明专利技术公开了一种波束形成方法、装置、电子设备及存储介质,该方法包括:对接收的语音信号进行预处理以获得对应的频域信号;将频域信号输入预先训练好的神经网络模型;利用神经网络模型中的N个卷积通道对频域信号进行处理,获得对应N个预设方向的N个固定波束,N为大于1的整数;利用神经网络模型中的注意力机制层计算N个固定波束中每个固定波束的权重,并根据计算结果判断语音信号的声源方向;将对应声源方向的固定波束进行输出。本发明专利技术基于神经网络模型进行语音信号的固定波束形成及声源方向判断,能够在不需要DOA估计以及嘈杂环境下准确的提取说话人方向波束,准确度和鲁棒性更高。更高。更高。

Beam forming method, device, electronic equipment and storage medium

【技术实现步骤摘要】
波束形成方法、装置、电子设备及存储介质


[0001]本专利技术涉及音频信号处理
,具体涉及一种波束形成方法、装置、电子设备及存储介质。

技术介绍

[0002]语音信号处理技术是当今人机交互领域的一项关键技术,麦克风阵列已被研究用于免提电话、电话会议、助听器、语音识别和语音增强。而麦克风阵列波束形成可以利用空间域信息,可以更好地增强语音信号,对后端的语音识别具有极其重要的作用,是语音信号处理的关键技术。
[0003]常规麦克风阵列波束形成方法是先进行声源方向估计,根据估计得到的声源方向对输入多通道信号进行相位补偿等操作,进而采用诸如最小无失真响应(minimum variance distortionless response,MVDR)等方法进行波束形成,进一步抑制旁瓣干扰。例如自适应波束形成方法,它们基于诸如广义旁瓣消除器(Generalized Sidelobe Canceller,GSC)以及最小方差无畸变响应(MVDR)之类的自适应波束形成,可以通过在小空间中布置少量麦克风来获得很高的抗干扰性能。虽然麦克风阵列的方向图是全本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种波束形成方法,其中,包括:对接收的语音信号进行预处理以获得对应的频域信号;将所述频域信号输入预先训练好的神经网络模型;利用所述神经网络模型中的N个卷积通道对所述频域信号进行处理,获得对应N个预设方向的N个固定波束,N为大于1的整数;利用所述神经网络模型中的注意力机制层计算所述N个固定波束中每个固定波束的权重,并根据计算结果判断所述语音信号的声源方向;将对应声源方向的固定波束进行输出。2.根据权利要求1所述的波束形成方法,其中对接收的语音信号进行预处理包括:将连续输入的所述语音信号进行分帧和加窗转换为短时平稳信号;将所述短时平稳信号通过短时傅里叶变换转换为所述频域信号。3.根据权利要求1所述的波束形成方法,其中,对神经网络模型的训练方法包括:基于超指向性波束形成器在相应方向上的权重向量确定所述神经网络模型的初始参数;将不同声源方向的语音信号对应的频域信号作为输入,将方向标签作为输出,对所述神经网络模型的初始参数进行训练。4.根据权利要求1所述的波束形成方法,其中,利用所述神经网络模型中的注意力机制层计算所述N个固定波束中每个固定波束的权重包括:将每个固定波束转换为嵌入向量;根据所述嵌入向量及训练得到的相应系数矩阵计算获得每个固定波束对应的Query值、Key值和Value值;根据每个固定波束对应的Query值和Key值分别为每个固定波束配置权重系数,并根据权重系数对Value值进行加权求和,以获得每个固定波束的权重。5.根据权利要求1

4任一项所述的波束形成方法,其中,所述N个预设方向包括:0
°
、30
°
、60
°

【专利技术属性】
技术研发人员:朱宸都
申请(专利权)人:北京奕斯伟计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1