基于深度学习的虚拟阵列扩展的波束形成方法技术

技术编号:37664266 阅读:30 留言:0更新日期:2023-05-26 04:21
本发明专利技术基于深度学习的虚拟阵列扩展的波束形成方法,涉及语音采集技术领域,通过将N条麦克风阵元的音频数据利用神经网络模型进行训练,获得M条音频数据,依据M条阵元的音频数据进行波束形成,解决了现有技术中在麦克风阵列确定的情况下无法提高波束性能的问题,本发明专利技术适用于语音采集。明适用于语音采集。明适用于语音采集。

【技术实现步骤摘要】
基于深度学习的虚拟阵列扩展的波束形成方法


[0001]本专利技术涉及语音采集
,特别涉及基于深度学习的虚拟阵列扩展的波束形成方法。

技术介绍

[0002]通常地,按照说话人和智能设备的距离不同,智能语音交互通常分为近场交互和远场交互,在近场交互中,通常只需要单个麦克风采集语音就可以满足要求了,对于远场语音交互,由于单个麦克风无法利用不同时延信号的相关性进行波束形成对空间中的干扰和噪声进行滤除,所以远场语音交互就需要使用麦克风阵列进行音频的采集和麦克风阵列波束形成。
[0003]作为智能语音识别系统中最重要的语音前端处理算法,麦克风阵列波束形成是一种集时间和空间信息的信号处理技术,它通过麦克风阵列采集由空间发送的语音信号并通过阵列信号处理的手段处理语音信号。
[0004]对于麦克风阵列,麦克风的数量越多,形成的波束有利于提高说话人方向的分辨率和指向准确率,从而使得处理后的音频的信干噪比就越高,智能语音识别系统的准确率就越高。然而对于实际产品和应用中,麦克风的数量越多,成本就越高,另外,承载麦克风阵列的硬件的排版和尺寸会有限制本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于深度学习的虚拟阵列扩展的波束形成方法,应用于包括N个阵元的麦克风阵列,其特征在于,包括以下步骤:S01、获取N个阵元的音频数据,并打上标签,获得N条音频数据;S02、将N条音频数据输入到神经网络模型中进行预测,获得M条音频数据,所述M大于N;S03、依据M条阵元的音频数据进行波束形成。2.根据权利要求1所述的基于深度学习的虚拟阵列扩展的波束形成方法,其特征在于,神经网络模型的训练过程如下:S201、选取包括M个阵元的麦克风阵列在不同背景噪声环境下采集说话人的语音,并打上标签,获得M条阵元的音频数...

【专利技术属性】
技术研发人员:李俊潇王阳宣彭世伟李晓冬
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1