一种基于快速全局K均值聚类的神经网络声源角度估计方法技术

技术编号：19009612 阅读：209 留言：0更新日期：2018-09-22 09:25

本发明专利技术公开了一种基于快速全局K均值聚类的神经网络声源角度估计方法，通过采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20，将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息；本发明专利技术对比已有技术，通过设置自适应选择半径以及结合全局K均值聚类算法中集合G的提出避免了已有聚类中心附近的点与所有输入点间距离的计算，大大降低了计算RBF神经网络参数的运算量。

A fast global K means clustering based neural network approach to acoustic source angle estimation

The present invention discloses a neural network acoustic source angle estimation method based on fast global K-means clustering. By collecting the time difference 10 between microphone M1 and microphone M0 and the time difference 20 between microphone M2 and microphone M0, the fast global K-means clustering optimized RBF neural network is obtained by inputting 10 and 20 into training. Compared with the existing techniques, the proposed method avoids the calculation of the distance between the points near the existing clustering center and all the input points by setting the adaptive selection radius and combining the set G in the global K-means clustering algorithm, and greatly reduces the calculation amount of RBF neural network parameters.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于快速全局K均值聚类的神经网络声源角度估计方法
本专利技术属于声源定位领域，具体涉及一种基于快速全局K均值聚类的神经网络声源角度估计方法。
技术介绍
声音信号是信息的一种常见载体，是感知环境特点的重要来源。声源定位技术就是利用麦克风等传感器获取声音信号，采用数字信号处理方法估计声源位置参数，具有成本低，实现难度小，适用范围广，在军事侦察、智能机器人、智能安防等领域均有应用。然而，实际环境嘈杂，混响、噪声等干扰信号不可避免，声音信号幅度会衰减，音质会变差，同时系统模型误差难以避免，因此角度估计的速度和精度会受到影响。近年来，相关学者研究了基于神经网络处理的声源角度估计方法，通过神经网络实现声达时间差(TDOA)与声源角度关系的非线性拟合，该方法具有良好的学习、容错能力，可有效缓解系统误差的影响。然而传统的BP神经网络使用的Sigmoid函数作为激励函数，能够在较大范围内对每个节点的输出值产生影响，同时激励函数在输入值的很大范围内相互重叠影响，因此BP神经网络训练过程很长。此外，由于BP算法的固有特性，BP神经网络容易陷入局部极小，并且神经网络隐层节点参数设置依赖于经验和试凑，严重影响实际工作性能。RBF神经网络在很大程度上克服了上述缺点，RBF神经网络不仅有良好的泛化能力，而且计算量小、训练速度快、不易陷入局部最优值。但是传统的RBF神经网络由于隐层神经元的位置通常是由训练数据中随机选取的，因此每次训练的结果不稳定，无法有效保证声源估计精度。此后基于K均值聚类优化的RBF神经网络方法虽然可以利用聚类处理改善神经元位置估计性能，但是初始值的设置是随机的，...
一种基于快速全局K均值聚类的神经网络声源角度估计方法

【技术保护点】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法，其特征在于，采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20，将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。

【技术特征摘要】
1.一种基于快速全局K均值聚类的神经网络声源角度估计方法，其特征在于，采集麦克风M1与麦克风M0的声达时间差τ10以及麦克风M2与麦克风M0的声达时间差τ20，将τ10和τ20输入训练完成的快速全局K均值聚类优化的RBF神经网络得到声源角度信息。2.如权利要求1所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法，其特征在于，M0，M1和M2以等腰直角三角形摆放，其中，M0摆放于直角位置。3.如权利要求1或2所述的一种基于快速全局K均值聚类的神经网络声源角度估计方法，其特征在于，快速全局K均值聚类优化的RBF神经网络的训练过程为：步骤一、利用对D个输入的点Xi求解RBF神经网络的K个高斯激励函数的中心；其中，Xi＝(τ10i,τ20i)，i＝1,2,...,D，τ10i和τ20i分别为第i个采集的M0和M1接收到声音的时间差和第i个采集的Μ0和Μ2接收到声音的时间差；步骤二、求解RBF神经网络的隐层神经元激活函数的宽度以及隐层神经元与输出层神经元的连接参数；步骤三、将上述求解出...

【专利技术属性】
技术研发人员：杨小鹏，李雨晴，刘泉华，曾涛，龙腾，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人