当前位置: 首页 > 专利查询>东南大学专利>正文

基于模拟退火算法的SRP-PHAT声源定位网格搜索方法技术

技术编号:21032032 阅读:22 留言:0更新日期:2019-05-04 04:38
本发明专利技术公开了基于模拟退火算法的SRP‑PHAT声源定位网格搜索方法,涉及声源定位技术,属于测量测试的技术领域。首先,将以MIC阵列为中心的搜索空间进行栅格化;然后,选择出现声源概率最大的栅格点作为模拟退火算法的初始当前解并计算对应的可控响应功率;将当前解随机移动到相邻的栅格点产生新解,计算可控响应功率,若新解可控响应功率大于当前解可控响应功率,则接收新解为当前解,否则以exp(‑Tdelta/T)的概率接收为当前解;将当前温度T下降Tdelta,将当前解随机移动到相邻的栅格点,确定新的当前解和新解;依此循环,直至满足一定条件结束,最大可控响应功率对应的解即是声源位置。本申请在不损失定位精度的条件下快速找到最大可控响应功率点,提高了定位的实时性。

SRP-PHAT Sound Source Location Grid Search Method Based on Simulated Annealing Algorithms

The invention discloses a grid search method for SRP PHAT sound source location based on simulated annealing algorithm, which relates to sound source location technology and belongs to the technical field of measurement and testing. Firstly, the searching space centered on MIC array is rasterized; then, the grid point with the largest probability of sound source is selected as the initial current solution of the simulated annealing algorithm and the corresponding controllable response power is calculated; the current solution is moved randomly to the adjacent grid point to generate a new solution, and the controllable response power is calculated, if the new solution is larger than the current controllable response power. Then the new solution is accepted as the current solution, otherwise the probability of exp (Tdelta/T) is received as the current solution; the current temperature T is lowered by Tdelta, and the current solution is randomly moved to the adjacent grid points to determine the new current solution and new solution; according to this cycle, until a certain condition is satisfied, the solution corresponding to the maximum controllable response power is the sound source location. The application can quickly find the maximum controllable response power point without losing the positioning accuracy, thus improving the real-time positioning.

【技术实现步骤摘要】
基于模拟退火算法的SRP-PHAT声源定位网格搜索方法
本专利技术公开了基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,涉及声源定位技术,属于测量测试的

技术介绍
SRP-PHAT声源定位算法结合了波束形成和广义互相关法的优点,既能抑制混响干扰又能抑制噪声,在真实环境下依然可以获得较高的定位精度和鲁棒性,近年来受到了广泛的关注和研究,但波束扫描网格搜索的特点使声源定位算法需要用方向性波束对整个空间逐点进行搜索,庞大的计算量使得实时地执行算法变得困难。因此,在保证定位精度不变的前提下,大量削减计算量,加快计算速度以适应实时目标探测就成为SRP-PHAT算法对声源目标定位研究的主要问题之一。SRP-PHAT声源定位算法中最大可控响应功率点即为声源位置,但其网格搜索实时性差是一个重要且难以解决的问题。为解决该问题,研究人员从包括缩减可控响应功率的计算量和优化网格搜索效率的不同角度提出了SRP-PHAT加速算法,其中,从缩减可控响应功率的计算量角度提出的SRP-PHAT加速算法比较固定且优化空间有限,而从优化网格搜索效率角度提出的SRP-PHAT加速算法抽象为求全局最优解问题,具有诸多的优化方法,是主要的优化着手点。常见的优化网络搜索效率的搜索算法有:由粗到精的空间搜索算法、基于概率的空间搜索算法、混合搜索算法、反映射搜索算法、分级搜索算法等,而基于概率的空间搜索算法需要充分利用声音功率谱特性,本专利技术正是为了充分利用声音功率谱特性,提出了一种基于退火算法的新型加速网格搜索方法以保证声源定位的实时性且不损失定位精度。
技术实现思路
本专利技术的专利技术目的是针对上述
技术介绍
的不足,提供了基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,充分利用声音功率谱特性以及模拟退火算法全局最优快速收敛的特性,在不损失定位精度的条件下快速找到最大可控响应功率点,提出了一种充分利用声音功率谱特性的新型加速网络搜索方法,解决了SRP-PHAT声源定位算法的网络搜索实时性差的技术问题。本专利技术为实现上述专利技术目的采用如下技术方案:基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,对以MIC阵列为中心的搜索空间进行栅格化处理的方法为:以MIC阵列几何中心为栅格中心,以距离栅格中心等间隔增加的长度为半径进行二维空间内的圆形栅格化或三维空间内的球形栅格化。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化放哪,对以MIC阵列为中心的搜索空间进行栅格化处理的方法还可以是:以MIC阵列几何中心为栅格中心,以栅格中心为正方形中心并以等间隔增长的长度为边长进行二维空间内的正方形栅格化,或,以栅格中心为正方体中心并以等间隔增长的长度为边长进行三维空间内的正方体栅格化。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,采用模拟退火算法寻求可控响应功率函数的全局最优解的方法为:按照当前温度值移动当前解到与其相邻的栅格点产生新解,在当前解可控响应功率计算时间与当前时间的差满足实时性要求时,计算新解的可控响应功率,否则,新解的可控响应功率仍为上一循环的计算值,在满足结束网络搜索条件时,以可控响应功率最大的解为全局最优解,否则,以exp(-Tdelta/T)的概率接收新解为当前解,T为模拟退火温度,Tdelta为模拟退火温度的调节量,递减模拟退火温度后进入下一循环。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,更新栅格化表格中全局最优解所对应栅格点声源出现频次值的方法为:对全局最优解所对应栅格点的频次值进行加一操作,全局最优解所对应栅格点的频次值加一操作后大于最大阈值时,更新全局最优解所对应栅格点的频次值为当前频次值与最大阈值的差值,若全局最优解所对应栅格点的频次加一操作后小于最小阈值时,更新全局最优解所对应栅格点的频次值为最小阈值。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,所述可控响应功率函数的表达式为:其中,Xk(ω)为第k个传声器信号xk(t)的加窗傅里叶变换,为第l个传声器信号xl(t)的加窗傅里叶变换信号的共轭信号,τl、τk分别为第k个、第l个传声器指向当前栅格点的可控时延,q为声源的空间位置向量,Ψkl(ω)为多信道形式的PHAT加权系数。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,结束网络搜索条件包含但不限于这三种:循环次数达到最大阈值,或者,模拟退火温度达到设定值,或者,循环次数超过最小阈值且连续数次的循环中新解和当前解的可控响应功率差值均满足阈值要求。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,以exp(-Tdelta/T)的概率接收新解为当前解的方法具体为:产生一个0~1之间的随机数,在该随机数大于exp(-Tdelta/T)时接受新解为当前解,否则,维持当前解不变。本专利技术采用上述技术方案,具有以下有益效果:(1)本专利技术采用模拟退火算法进行网格搜索时基于历史声源位置频次表建立初始条件,同时,通过调节模拟退火的关键控制要素温度T动态调整栅格移动的步长,保证了算法的收敛速度;(2)本专利技术提供的SRP-PHAT声源定位网格搜索方法结合了波束形成和广义互相关法的优点,既能抑制混响干扰又能抑制噪声,利用模拟退火算法全局最优快速收敛的特性快速搜索整个空间,保证了声源定位的实时性而且不会损失精度。附图说明图1为本专利技术声源定位网络搜索方法的流程图。具体实施方式下面结合附图对专利技术的技术方案进行详细说明。本申请采用固体退火算法模拟SRP-PHAT的全局寻优过程,具体是将内能E模拟为可控响应功率,将随机移动步长演化为温度T,具体流程如图1所示,包括如下八个步骤。步骤一:初始化算法环境;设定模拟退火算法的初始温度T为充分大,将以MIC阵列为中心的搜索空间栅格化,栅格大小取决于对精度和实时性的要求,栅格越大,精度越低,实时性越好,反之,栅格越小,精度越高,实时性越差;根据圆形或者方形栅格化规则建立栅格化表格表示出整个搜索空间,栅格化表格中的值包含三个部分:声源在该栅格点出现的频次,计算可控响应功率的时间和在该栅格点计算出的可控响应功率值。步骤二:根据各栅格点声源出现的历史概率选择出现概率最大的栅格点作为模拟退火算法的初始当前解,若无声源历史记录,则按照平均分布随机选择栅格点作为模拟退火算法的初始当前解,计算退火算法各解的可控响应功率的公式如下:其中:Xk(ω)为第k个传声器信号xk(t)的加窗傅里叶变换;为第l个传声器信号xl(t)的加窗傅里叶变换信号的共轭信号;τ是阵列指向声源的可控时延,用于补偿每个传声器理想信号的直接路径传播延时,τl、τk分别为第k个、第l个传声器指向当前栅格点的可控时延,q为声源的空间位置向量;Ψk本文档来自技高网
...

【技术保护点】
1.基于模拟退火算法的SRP‑PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格。

【技术特征摘要】
1.基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格。2.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理的方法为:以MIC阵列几何中心为栅格中心,以距离栅格中心等间隔增加的长度为半径进行二维空间内的圆形栅格化或三维空间内的球形栅格化。3.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理的方法还可以是:以MIC阵列几何中心为栅格中心,以栅格中心为正方形中心并以等间隔增长的长度为边长进行二维空间内的正方形栅格化,或,以栅格中心为正方体中心并以等间隔增长的长度为边长进行三维空间内的正方体栅格化。4.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,采用模拟退火算法寻求可控响应功率函数的全局最优解的方法为:按照当前温度值移动当前解到与其相邻的栅格点产生新解,在当前解可控响应功率计算时间与当前时间的差满足实时性要求时,计算新解的可控响应功率,否则,新解的可控响应功率仍为上一循环的计算值,在满足结束网络搜索条件时,以可控响应功率最大的解为全局最优解,否则,以exp(-Tdelta/T)的概率接收新解为当前解...

【专利技术属性】
技术研发人员:齐志马亚南刘昊吴建辉时龙兴
申请(专利权)人:东南大学东南大学—无锡集成电路技术研究所
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1