The present invention discloses a neural network acoustic source angle estimation method based on fast global K-means clustering. By collecting the time difference 10 between microphone M1 and microphone M0 and the time difference 20 between microphone M2 and microphone M0, the fast global K-means clustering optimized RBF neural network is obtained by inputting 10 and 20 into training. Compared with the existing techniques, the proposed method avoids the calculation of the distance between the points near the existing clustering center and all the input points by setting the adaptive selection radius and combining the set G in the global K-means clustering algorithm, and greatly reduces the calculation amount of RBF neural network parameters.
【技术实现步骤摘要】
一种基于快速全局K均值聚类的神经网络声源角度估计方法
本专利技术属于声源定位领域,具体涉及一种基于快速全局K均值聚类的神经网络声源角度估计方法。
技术介绍
声音信号是信息的一种常见载体,是感知环境特点的重要来源。声源定位技术就是利用麦克风等传感器获取声音信号,采用数字信号处理方法估计声源位置参数,具有成本低,实现难度小,适用范围广,在军事侦察、智能机器人、智能安防等领域均有应用。然而,实际环境嘈杂,混响、噪声等干扰信号不可避免,声音信号幅度会衰减,音质会变差,同时系统模型误差难以避免,因此角度估计的速度和精度会受到影响。近年来,相关学者研究了基于神经网络处理的声源角度估计方法,通过神经网络实现声达时间差(TDOA)与声源角度关系的非线性拟合,该方法具有良好的学习、容错能力,可有效缓解系统误差的影响。然而传统的BP神经网络使用的Sigmoid函数作为激励函数,能够在较大范围内对每个节点的输出值产生影响,同时激励函数在输入值的很大范围内相互重叠影响,因此BP神经网络训练过程很长。此外,由于BP算法的固有特性,BP神经网络容易陷入局部极小,并且神经网络隐层节点参数设置依 ...
【技术保护点】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。
【技术特征摘要】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20,将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。2.如权利要求1所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,M0,M1和M2以等腰直角三角形摆放,其中,M0摆放于直角位置。3.如权利要求1或2所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法,其特征在于,快速全局K均值聚类优化的RBF神经网络的训练过程为:步骤一、利用对D个输入的点Xi求解RBF神经网络的K个高斯激励函数的中心;其中,Xi=(τ10i,τ20i),i=1,2,...,D,τ10i和τ20i分别为第i个采集的M0和M1接收到声音的时间差和第i个采集的Μ0和Μ2接收到声音的时间差;步骤二、求解RBF神经网络的隐层神经元激活函数的宽度以及隐层神经元与输出层神经元的连接参数;步骤三、将上述求解出...
【专利技术属性】
技术研发人员:杨小鹏,李雨晴,刘泉华,曾涛,龙腾,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。