一种基于快速全局K均值聚类的神经网络声源角度估计方法技术

技术编号:19009612 阅读:209 留言:0更新日期:2018-09-22 09:25
本发明专利技术公开了一种基于快速全局K均值聚类的神经网络声源角度估计方法,通过采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息;本发明专利技术对比已有技术,通过设置自适应选择半径以及结合全局K均值聚类算法中集合G的提出避免了已有聚类中心附近的点与所有输入点间距离的计算,大大降低了计算RBF神经网络参数的运算量。

A fast global K means clustering based neural network approach to acoustic source angle estimation

The present invention discloses a neural network acoustic source angle estimation method based on fast global K-means clustering. By collecting the time difference 10 between microphone M1 and microphone M0 and the time difference 20 between microphone M2 and microphone M0, the fast global K-means clustering optimized RBF neural network is obtained by inputting 10 and 20 into training. Compared with the existing techniques, the proposed method avoids the calculation of the distance between the points near the existing clustering center and all the input points by setting the adaptive selection radius and combining the set G in the global K-means clustering algorithm, and greatly reduces the calculation amount of RBF neural network parameters.

【技术实现步骤摘要】
一种基于快速全局K均值聚类的神经网络声源角度估计方法
本专利技术属于声源定位领域,具体涉及一种基于快速全局K均值聚类的神经网络声源角度估计方法。
技术介绍
声音信号是信息的一种常见载体,是感知环境特点的重要来源。声源定位技术就是利用麦克风等传感器获取声音信号,采用数字信号处理方法估计声源位置参数,具有成本低,实现难度小,适用范围广,在军事侦察、智能机器人、智能安防等领域均有应用。然而,实际环境嘈杂,混响、噪声等干扰信号不可避免,声音信号幅度会衰减,音质会变差,同时系统模型误差难以避免,因此角度估计的速度和精度会受到影响。近年来,相关学者研究了基于神经网络处理的声源角度估计方法,通过神经网络实现声达时间差(TDOA)与声源角度关系的非线性拟合,该方法具有良好的学习、容错能力,可有效缓解系统误差的影响。然而传统的BP神经网络使用的Sigmoid函数作为激励函数,能够在较大范围内对每个节点的输出值产生影响,同时激励函数在输入值的很大范围内相互重叠影响,因此BP神经网络训练过程很长。此外,由于BP算法的固有特性,BP神经网络容易陷入局部极小,并且神经网络隐层节点参数设置依赖于经验和试凑,严重影响实际工作性能。RBF神经网络在很大程度上克服了上述缺点,RBF神经网络不仅有良好的泛化能力,而且计算量小、训练速度快、不易陷入局部最优值。但是传统的RBF神经网络由于隐层神经元的位置通常是由训练数据中随机选取的,因此每次训练的结果不稳定,无法有效保证声源估计精度。此后基于K均值聚类优化的RBF神经网络方法虽然可以利用聚类处理改善神经元位置估计性能,但是初始值的设置是随机的,因此在声源角度估计应用中精度仍然不够高。
技术实现思路
有鉴于此,本专利技术提供了一种基于快速全局K均值聚类的神经网络声源角度估计方法,能够获得高精度的声源角度估计结果。实现本专利技术的技术方案如下:一种基于快速全局K均值聚类的神经网络方法,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。进一步地,M0,M1和M2以等腰直角三角形摆放,其中,M0摆放于直角位置。进一步地,快速全局K均值聚类优化的RBF神经网络的训练过程为:步骤一、利用对D个输入的点Xi求解RBF神经网络的K个高斯激励函数的中心;其中,Xi=(τ10i,τ20i),i=1,2,...,D,τ10i和τ20i分别为第i个采集的M0和M1接收到声音的时间差和第i个采集的Μ0和Μ2接收到声音的时间差;步骤二、求解RBF神经网络的隐层神经元激活函数的宽度以及隐层神经元与输出层神经元的连接参数;步骤三、将上述求解出的各参量代入RBF神经网络中完成RBF神经网络的训练。进一步地,步骤一的具体过程为:步骤1.1、对所有Xi求平均值得到第一个聚类中心,将其作为第一个高斯激励函数的中心;步骤1.2、当计算第k个聚类中心时,k≥2,通过以下公式求解第k-1个高斯激励函数中心去除范围的半径Rk-1,利用Rk-1去除第k-1个高斯激励函数的中心周围的点集,得到第k个聚类中心的候选点集为其中,ξ是约束系数,sqrt(...)为开方运算,是第k-1个聚类半径,ck-1和nk-1分别是第k-1个聚类中心和该聚类中的点的个数;其中,Xinput为D个输入的点Xi组成的点集;Xm为候选点集中的任一个点;步骤1.3、利用三角不等式方法在Xinput中选出集合G;其中,cti为距离Xi最近的聚类中心,ω为约束系数,为Xi与cti距离的平方;步骤1.4、求解Xm的特征参数bm,找出最大的bm所对应的Xm,作为第k个聚类中心,即为第k个高斯激励函数的中心;有益效果:本专利技术提出一种基于快速全局K均值聚类RBF神经网络,对比已有技术,通过设置自适应选择半径以及结合全局K均值聚类算法中集合G的提出避免了已有聚类中心附近的点与所有输入点间距离的计算,大大降低了计算RBF神经网络参数的运算量,其效果具体如下:(1)本专利技术避免了已有聚类中心附近的点与所有输入点间距离的计算,大大降低了计算RBF神经网络参数的运算量。(2)本专利技术中基于快速全局K均值的方法,提出了集合G,在传统全局K均值的基础上在计算候选者点的bm时避免了计算候选者点与所有输入数据间的距离,在保证算法性能的基础上进一步降低计算量;(3)本专利技术采用RBF神经网络进行声源角度估计,利用了神经网络具有强鲁棒性这一特点,在有环境噪声干扰的情况下仍然可以得到较为准确的声源角度估计结构。附图说明图1为本专利技术方法流程图;图2为麦克风阵与声源的几何结构;图3为K均值、GK均值以及FGK均值聚类结果的MSE;图4为基于仿真实验的BP、RBF、K-RBF、GK-RBF以及FGK-RBF神经网络的近场声源角度估计误差比较;其中图(a)为方位角误差,(b)为俯仰角误差;图5为基于仿真实验的BP、RBF、K-RBF、GK-RBF以及FGK-RBF神经网络的远场声源角度估计误差比较;其中图(a)为方位角误差,(b)为俯仰角误差;图6为室内实验场景图;其中图(a)为近场实验,(b)为远场实验;图7为基于室内实验的BP、RBF、K-RBF、GK-RBF以及FGK-RBF神经网络的近场声源角度估计误差比较;其中图(a)为方位角误差,(b)为俯仰角误差;图8为基于室内实验的BP、RBF、K-RBF、GK-RBF以及FGK-RBF神经网络的远场声源角度估计误差比较;其中图(a)为方位角误差,(b)为俯仰角误差;具体实施方式下面结合附图并举实施例,对本专利技术进行详细描述。如图1所示,一种基于快速全局K均值聚类的神经网络声源角度估计方法,具体包括如下步骤:一种基于快速全局K均值聚类的神经网络方法,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。首先建立信号模型:麦克风阵列包括三个麦克风M0,M1,M2,按照等腰直角三角形摆放,其中,M0摆放于直角位置。声源S的坐标为(x,y,z),其在麦克风阵平面的投影是S’,其方位角和俯仰角依次为θ和S到M0及M1的距离差为d10=vτ10,其中τ10是M0和M1接收到声音的时间差,v是声音在空气中的传播速度。S到Μ0及Μ2的距离差为d20=vτ20,其中τ20是Μ0和Μ2接收到声音的时间差。S到Μ0的距离为d0=vτ0,其中τ0是从声源发声到麦克风M0接收到声音所用的时间。假设声音信号为s(t),其中t表示时间,Μ0、Μ1和Μ2的接收信号s0(t)、s1(t)和s2(t)可表示为其中,n(t)是环境噪声。根据麦克风阵列与声源的几何关系,可得下式声源的方位角θ和俯仰角可通过神经网络拟合声源角度与声达时间差之间的非线性方程计算得到:其中,L是麦克风M1(Μ2)与麦克风M0之间的距离。快速全局K均值聚类优化的RBF神经网络的训练过程为:步骤一、利用对D个输入的点Xi求解RBF神经网络的K个高斯激励函数的中心;其中,Xi=(τ10i,τ20i),i=1,2,...,D,τ10i和τ20i分别为第i个采集的M0和M1接收到声音的时间差和第i个本文档来自技高网
...
一种基于快速全局K均值聚类的神经网络声源角度估计方法

【技术保护点】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。

【技术特征摘要】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。2.如权利要求1所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,M0,M1和M2以等腰直角三角形摆放,其中,M0摆放于直角位置。3.如权利要求1或2所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,快速全局K均值聚类优化的RBF神经网络的训练过程为:步骤一、利用对D个输入的点Xi求解RBF神经网络的K个高斯激励函数的中心;其中,Xi=(τ10i,τ20i),i=1,2,...,D,τ10i和τ20i分别为第i个采集的M0和M1接收到声音的时间差和第i个采集的Μ0和Μ2接收到声音的时间差;步骤二、求解RBF神经网络的隐层神经元激活函数的宽度以及隐层神经元与输出层神经元的连接参数;步骤三、将上述求解出...

【专利技术属性】
技术研发人员:杨小鹏李雨晴刘泉华曾涛龙腾
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1