当前位置: 首页 > 专利查询>黑龙江大学专利>正文

一种基于神经网络的复合型空间分布麦克风声源定位方法技术

技术编号:20903367 阅读:41 留言:0更新日期:2019-04-17 17:04
本发明专利技术提供了一种基于神经网络的空间分布麦克风复合型声源定位方法,麦克风通过数据接口与处理器连接,任取一个麦克风作为基准把麦克风,麦克风接收到声音信号并由数模转化器转换为数字信号传输至处理器,处理器将各克风信号强度与基准麦克风信号强度的比值代入BP神经网络,得出声源所在的子空间。本发明专利技术使用神经网络与功率比相结合的方法,限定了全局极大值的位置,从而在互相关算法取值长度较短的情况下仍可得到全局极大值,从而达到快速精确定位。

【技术实现步骤摘要】
一种基于神经网络的复合型空间分布麦克风声源定位方法
本专利技术涉及一种基于神经网络的空间分布麦克风复合型声源定位方法,属于声源定位

技术介绍
近年来随着云计算和人工智能领域技术的日渐成熟,智能家居正逐步进入普通人家庭。声音作为人类最熟悉的交流方式,也正在逐步取代按键和触屏,成为智能家居中最常用的人机交互方式。由于单麦克风波束指向固定,信噪比较低,已不能满足语音识别对信号质量的要求,由多麦克风组成的麦克风阵列已经成为语音信号拾取的主流技术。由于麦克风阵列语音增强的核心技术为波束形成法,即将麦克风阵列波束主瓣方向对准声源方向,所以声源定位便尤为重要,基于传播模型拟合的SOA算法计算量小但易受空间混响影响,定位精度差,基于经验的指纹定位的SOA算法计算量小且定位较精确,但前期准备工作量大,且由于指纹法需要为每个房间建立特定的数据库,很难推广。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供了一种基于神经网络的空间分布麦克风复合型声源定位方法,使用神经网络技术吸纳了各定位方法的优点,并解决上述定位方法的缺点,在保证定位精度的前提下,在使用中逐步减小运算的数据量。本专利技术所采用的技术方案是:麦克风通过数据接口与处理器电连接,任取一个麦克风作为基准把麦克风,麦克风接收到声音信号并由数模转化器转换为数字信号传输至处理器,处理器将各克风信号强度与基准麦克风信号强度的比值代入BP神经网络,得出声源所在的子空间,并根据子空间位置对各麦克风进行时延补偿,然后用神经网络关算法,算出经过时延补偿后各麦克风接收到的信号,与基准信号之间精确时延,且根据d=c*t,得到各麦克风距离声源的距离差,联立方程得到声源位置,定位完成后再次对各声音信号进行整体互相关运算得出声源位置,作为训练集代入BP神经网络,对神经网络进行训练,从而定位BP神经网络的子空间。进一步地,声源定位方法具体步骤为:步骤一:将8个麦克风组成一个空间麦克风阵列,并将每个所述麦克风进行标号M1,M2…Mn;步骤二:将三维空间均等分为若干个正方体,并将每个所述正方体视为一个声源区间,共N个;步骤三:将步骤一所述的麦克风阵列摆放于需要声源定位的所述三维空间中,并且,将麦克风阵列中包含的麦克风设置于需定位的三维空间顶点和空间棱边上,麦克风摆放好后,麦克风的位置和对应的标号不再变动;步骤四:根据声音在空气中传播时功率衰减公式及步骤二所划分的空间,计算单位功率声源在各声源区间内随机位置发声时,麦克风阵列接收到能量信号的比值,将该比值作为特征值,比值对应声源区间的one-hot形式作为标签值,共同构成向量,所作训练集储存。步骤五:建立BP神经网络模型,输入层为比值向量,共七个比值,隐含层根据声源区间多少更改深度及神经节点数,输出层共N个神经节点。步骤六:将步骤四所得到的训练集代入步骤五建立的神经网络进行训练,drop-out值设为0.5,对损失值进行梯度下降运算时加入L2正则化,以防止网络过拟合,从而得到由理论值训练而来的神经网络。步骤七:当声源在定位空间内发声时,计算麦克风根据接收到声音的短时功率强度比,将该比值代入神经网络,快速得到声源区间编号。步骤八:通过编号对各麦克风接收到的信号进行时延补偿,对补偿后的信号截取相对较短时间信号,使用TDOA计算精确时延差,与补偿值相加即可得出声源与各麦克风距离差,根据空间三点定位方法,代入公式即可求出声源精确位置。步骤九:定位结束后,截取相对较长时间信号,使用传统定位算法,计算声源位置,并将各麦克风接收到的信号功率及声源位置构成的向量,作为训练数据对训练集进行更新,使用更新后的数据,对神经网络模型重新训练。有益效果传统定位方法主要使用互相关算法,由于互相关算法的运算量与取值长度呈平方关系,取值太长会导致运算量过大,实时性不好且该缺点会随着应用空间增大而越专利技术显,如取值过小则容易陷入局部极大值从而导致定位不准,本专利技术方法使用神经网络与功率比相结合的方法,限定了全局极大值的位置,从而在互相关算法取值长度较短的情况下仍可得到全局极大值,从而达到快速精确定位。附图说明图1为本专利技术麦克风摆放位置及子空间示意图;图2为本专利技术BP神经网络示意图;图3为本专利技术工作流程图。具体实施方式实施例:假设需定位房间为7m*7m*3m的空间,在房间四个墙角顶部和房间四角距地面2m处安装麦克风和数模转换器,组成一个空间麦克风阵列。记录每个麦克风相对坐标,克风进行标号M1,M2…Mn,默认M1为标准麦克风。麦克风通过数据接口与处理器连接。根据图1,将麦克风所包围的立方体空间均等分为100cm*100cm*75cm方体,并将每个所述正方体视为一个声源区间,共98个声源空间。声源空间大小可随需定位空间大小相应改变;根据三维空间距离公式(式1)及声音在空气中传播时功率衰减公式(式2),以及步骤二所划分的空间,计算单位功率声源在各声源区间内随机位置发声时,麦克风阵列接收到信号与标准麦克风接收到信号能量的比值,将该比值作为特征值,该特征值对应声源区间的one-hot形式作为标签值,共同构成向量,作为训练集储存。根据如图2,建立BP神经网络模型,输入层为比值向量,共七个比值,隐藏层根据声源区间多少更改深度及神经节点数,本例中使用两层隐含层,第一层包含30个神经节点,第二层包含120个神经节点,层与层之间使用sigmoid激活函数增加非线性拟合能力,输出层共98个神经节点,每个输出神经节点对应一个声源空间。将步骤四所得到的训练集代入步骤五建立的神经网络进行训练,drop-out值设为0.5,对损失值进行梯度下降运算时加入L2正则化,以防止网络过拟合,从而得到由理论值训练而来的神经网络,98个输出神经元数值为Y1至Y98,预测概率计算公式如下:i目标=argmax(P(i))式4即使得P(i)最大化的i值所对应的声源空间被认定为声源位置。当声源在定位空间内发声时,计算麦克风根据接收到声音与标准麦克风的短时功率比,将该比值代入神经网络,快速得到声源区间编号。通过编号所对应声源区间的位置,对各麦克风接收到的信号进行时延补偿,这样便将在较大空间内的定位,转化为在较小定位区间内的定位,对补偿后的信号截取相同位置20ms信号,使用TDOA计算精确时延差t目标(式5),与补偿值相加即可得出声源与各麦克风距离差。根据空间三点定位方法,联立方程代入数据即可求出声源精确位置。定位结束后,截取相对较长时间信号,使用传统定位算法,计算声源位置,并将各麦克风接收到的信号功率及声源位置构成的向量,作为训练数据对训练集进行更新,使用更新后的数据,对神经网络模型重新训练。本文档来自技高网...

【技术保护点】
1.一种基于神经网络的空间分布麦克风复合型声源定位方法,其特征在于:麦克风通过数据接口与处理器连接,任取一个麦克风作为基准麦克风,基准麦克风接收到声音信号并由数模转化器转换为数字信号传输至处理器,处理器将基准麦克风信号强度值代入BP神经网络算法,计算出声源所在的子空间。

【技术特征摘要】
1.一种基于神经网络的空间分布麦克风复合型声源定位方法,其特征在于:麦克风通过数据接口与处理器连接,任取一个麦克风作为基准麦克风,基准麦克风接收到声音信号并由数模转化器转换为数字信号传输至处理器,处理器将基准麦克风信号强度值代入BP神经网络算法,计算出声源所在的子空间。2.根据权利要求1所述的一种基于神经网络的空间分布麦克风复合型声源定位方法,其特征在于:基准麦克风通过子空...

【专利技术属性】
技术研发人员:刘勇孙志啸
申请(专利权)人:黑龙江大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1