一种基于双麦克风的神经网络声源测向方法及系统技术方案

技术编号:26595141 阅读:54 留言:0更新日期:2020-12-04 21:16
本发明专利技术提供了一种基于双麦克风的神经网络声源测向方法和系统,该神经网络声源测向方法包括执行以下步骤:双路采样信号的获取步骤:采用两个麦克风采集两路声源信号的时域数据,并将采集到的时域数据同时传输到神经网络分析模块和相关性特征提取模块;输出特征获取步骤:采用神经网络分析模块接收步骤1采集的时域数据,神经网络分析模块包括输入层、隐藏层1、隐藏层2、隐藏层3和输出层,神经网络分析模块将接收的时域数据通过递归神经层分析两路声源信号之间的时序关系,最后在隐藏层2得到处理后的输出特征;相关性特征提取步骤:后续处理步骤。本发明专利技术的有益效果是:采用两个麦克风实现声源检测,降低语音产品的成本和功耗。

【技术实现步骤摘要】
一种基于双麦克风的神经网络声源测向方法及系统
本专利技术涉及数据处理领域,尤其涉及一种基于双麦克风的神经网络声源测向方法及系统。
技术介绍
目前,市面上的语音产品多采用单麦克风系统进行语音的拾取和处理,通常情况下这类产品都会采用一个高性能、高方向性的方向型麦克风来获取高质量的声源信号。但是,高方向性的单一麦克风系统只能拾取一路声源信号,并且无法随着声源的移动来调整麦克风的方向,这就大大限制了其使用的灵活性。此外,在一些对声源的方向和位置有需求的产品来说,单麦克风系统不具备自动探测方位、追踪声源的能力。虽然,市面上已经有了一些利用多个麦克风组成阵列来增强语音产品对声源位置敏感的方法,但是这些产品通常需要4个以上的麦克风来实现,在很大程度上也增加了语音产品的成本和功耗。
技术实现思路
本专利技术提供了一种基于双麦克风的神经网络声源测向方法,包括执行以下步骤:双路采样信号的获取步骤:采用两个麦克风采集两路声源信号的时域数据,并将采集到的时域数据同时传输到神经网络分析模块和相关性特征提取模块;输出特征获取步骤:采用神本文档来自技高网...

【技术保护点】
1.一种基于双麦克风的神经网络声源测向方法,其特征在于,包括执行以下步骤:/n双路采样信号的获取步骤:采用两个麦克风采集两路声源信号的时域数据,并将采集到的时域数据同时传输到神经网络分析模块和相关性特征提取模块;/n输出特征获取步骤:采用神经网络分析模块接收双路采样信号的获取步骤采集的时域数据,神经网络分析模块包括输入层、隐藏层1、隐藏层2、隐藏层3和输出层,神经网络分析模块将接收的时域数据通过递归神经层分析两路声源信号之间的时序关系,最后在隐藏层2得到处理后的输出特征;/n相关性特征提取步骤:采用相关性特征提取模块接收双路采样信号的获取步骤采集的时域数据,然后再由相关性特征提取模块计算出所接...

【技术特征摘要】
1.一种基于双麦克风的神经网络声源测向方法,其特征在于,包括执行以下步骤:
双路采样信号的获取步骤:采用两个麦克风采集两路声源信号的时域数据,并将采集到的时域数据同时传输到神经网络分析模块和相关性特征提取模块;
输出特征获取步骤:采用神经网络分析模块接收双路采样信号的获取步骤采集的时域数据,神经网络分析模块包括输入层、隐藏层1、隐藏层2、隐藏层3和输出层,神经网络分析模块将接收的时域数据通过递归神经层分析两路声源信号之间的时序关系,最后在隐藏层2得到处理后的输出特征;
相关性特征提取步骤:采用相关性特征提取模块接收双路采样信号的获取步骤采集的时域数据,然后再由相关性特征提取模块计算出所接收的时域数据中两路声源信号多个角度的相关性系数,并将相关性系数与神经网络分析模块隐藏层2的输出特征级联;
后续处理步骤:级联后的输出特征给到神经网络分析模块的隐藏层3进行后续处理,并在神经网络分析模块的输出层给出角度的分类结果。


2.根据权利要求1所述的神经网络声源测向方法,其特征在于,在执行后续处理之后还包括执行以下步骤:
统计判断步骤:采用统计判断模块对设定值内所有帧的角度的分类结果进行计数统计,最后将计数值最高的角度值作为每秒的测向结果输出。


3.根据权利要求1所述的神经网络声源测向方法,其特征在于,在所述输出特征获取步骤中,还包括执行以下步骤:
步骤1:采用44kHz的采样频率,采样数据分帧进行处理,每帧的帧长为5ms,每帧220个采样点;
步骤2:所述输入层每次输入两路采样数据;所述隐藏层1采用对时间序列具有记忆作用的LSTM神经网络结构;所述隐藏层2、所述隐藏层3和所述输出层采用全连接层结构。


4.根据权利要求3所述的神经网络声源测向方法,其特征在于,在所述步骤2中,所述输入层一共输入440维数据,所述隐藏层1一共采用了256个LSTM神经元,所述隐藏层2采用128个神经元,所述隐藏层3采用64个神经元,所述输出层采用7个神经元。


5.根据权利要求3所述的神经网络声源测向方法,其特征在于,在所述步骤2中,所述LSTM神经网络结构运算原理如下:
LSTM单元将当前帧输入的特征tn与之前保留的输出结果hn-1进行组合,同时也将上一帧数据留存的状态Cn-1一起输入进去进行处理,产生一个当前帧的输出hn和一个当前帧的输出状态Cn,如此反复地进行递归操作来捕捉信号间的时序关系,其中每次运算产生的当前帧输出hn会传递给隐藏层(3)执行后续的运算。


6.根据...

【专利技术属性】
技术研发人员:刘明周彦兵孙冲武赵学华高波
申请(专利权)人:深圳信息职业技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1