基于Delaunay三角剖分的粒子滤波声源跟踪定位方法技术

技术编号:19487527 阅读:32 留言:0更新日期:2018-11-17 11:40
本发明专利技术提出了公开一种基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,该方法能够在己知室内空间尺寸的条件下,仅利用说话人身上佩戴的智能手机,通过对空间进行Delaunay三角剖分,利用Delaunay三角剖分结果,将室内物理空间中随机的粒子进行有序的关联,基于声衰模型的理论分析,确定移动声源附近的粒子搜索范围,且将该搜索范围集合估值代入到粒子滤波目标跟踪框架中,利用增强粒子滤波算法进行室内场景说话人跟踪定位。该定位方法具有一定的抗噪性、抗混响和鲁棒性。本发明专利技术方法不仅适用于规则形状的室内声场环境,也适用于非规则形状的室内声场环境的说话人定位与跟踪。

【技术实现步骤摘要】
基于Delaunay三角剖分的粒子滤波声源跟踪定位方法
本专利技术涉及室内声源定位领域,具体是一种基于语音信号声衰模型和Delaunay三角剖分结果,确定声源活动范围,利用增强粒子滤波算法进行室内场景说话人跟踪定位的方法,在人机交互、远程会议、位置服务等场景中有重要的应用价值。
技术介绍
国际通信标准给出人正常的发声频率范围是300Hz-3400Hz。在室内声场中,距离正常语音声源20cm的声压级(SPL)为72dB,距离1米的SPL为58dB。语音信号的能量衰减与接收距离的成正相关关系,且声音频率越高,声能衰减越快。目前己有一些基于声音能量的测算实现声源定位的方案,但大都需要搭建无线网络锚点,采用节点间协作的方式进行,并依赖室内声场的先验条件,如:将声接收端放置于无线传感网络的特定区域内,降低空间遍历复杂度,提高系统实用性;或者以特定场景下的最小收发距离设定SPL最小阈值,通过比较协作节点间的SPL大小,解决空间数据相关问题,提高定位系统准确性等。然而,此类工作并未充分利用室内声场声能概率密度分布的统计规律,及声衰模型的理论优势,且在有混响和噪声的环境中,声源定位精度得不到保证。通过对室内空间的声能概率密度分布建模,建立室内声能密度分布与声传播距离的数学关系,既可利用声衰模型公式计算声波接收位置的声能,也可以应用于求解室内声场分布与辨识问题。因此,声能概率密度分布建模是基于声能计算实现室内说话人定位的关键环节,建模方法的优劣则直接影响到定位算法的准确性与鲁棒性。为了降低定位算法复杂性,提高定位方案的实时性,我们将室内物理空间建模问题转化为复杂曲面剖分问题,即将室内空间剖分为多个简单多面体,然后利用这些简单多面体进行声音活跃区域的检测,对于每次声源位置的跟踪迭代而言,只需调节并行处理的节点数,就能使得声波活跃区域检测在可容忍的时间范围内完成,能缩小检测搜索范围,降低算法复杂度,提高跟踪实时性,且这种剖分过程只需一次预处理,在声源跟踪过程,不需要重复剖分。
技术实现思路
针对室内复杂声场环境中,噪声干扰大、混响影响严重,导致室内说话人跟踪定位精度仍然不足的问题,本专利技术提出了一种基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,实现室内说话人自定位与跟踪。该方法只需要对室内物理空间进行一次Delaunay三角剖分,将剖分结果与粒子滤波目标跟踪框架的各阶段搜索范围进行融合,解决了传统粒子滤波算法中因大面积重采样导致运算量庞大的问题,并借助人体身上佩戴的智能手机与语音声源点的近距离关系,使得该定位方案具有一定的抗噪性、抗混响和鲁棒性。本专利技术基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,包括如下步骤:S1.说话人用身上佩戴的智能手机录制当前位置的语音信号,作为目标声能;S2.基于语音信号声衰模型计算目标声能特征;S3.对室内空间进行Delaunay三角剖分;S4.采用增强粒子滤波对目标跟踪,通过滤波算法对粒子初始化,结合Delaunay三角剖分结果,将粒子滤波目标跟踪框架中各阶段的范围选择问题转化为Delaunay三角锥体节点的选择问题,通过寻找上一时刻目标位置相邻的Delaunay三角形顶点集,确定当下粒子的搜索范围(即声源活跃范围),得到粒子与目标之间相似度;S5.得到的每个粒子与目标的相似度,做加权平均,得到目标坐标的估计值;S6.输出目标位置3D坐标,实现移动声源(说话人)的实时跟踪定位。声能可以用一个向量来表示,因此,目标声能特征就是一个N*1的向量V。语音声,又称言语声,是人类通过发声器官发出,用于社会交际的声音。按发声功能分,人的发声器官可分为激励源、发声体和共鸣器三个部分。S2.所述计算目标声能特征,具体方法如下:假设声源由人的嘴巴发出,设由嘴巴发出的语音声为s(n),手机麦克风接收到的语音信号为x(n),室内噪声为零均值的加性白噪声为v(n),则这三者的关系为:x(n)=s(n)+v(n)(1)其中,γ是手机麦克风的增益因子,a(n-τ)是由人的嘴巴所发语音的声能密度,τ是从嘴巴到手机麦克风的传输时延,ps(n-τ)是一个3*1的向量,表示嘴巴所在位置;px也是一个3*1的向量,表示手机麦克风所在位置;dsc=||ps(n-τ)-px||,设置为一个常数值;对(1)式两边计算能量均值,得到:E[x2(n)]=E[s2(n)]+E[v2(n)](3)其中上式中,g=γ2,由于假设dsx是一个常值,那么从发声位置到麦克风位置的距离很小,则τ可以忽略不计,因此,a(n-τ)≈a(n),ps(n-τ)≈ps(n),由于能量均值是在长为T的时间窗内进行的,则当采样频率为fs时,M=T*fs是用于能量平均的采样点个数;设E[x2(n)]=yx(t),E[a2(n)]=ys(t),E[v2(n)]=∈t,则基于声衰模型的目标声能特征可表示为:yx(t)=ys(t)+∈(t)(5)其中,如果M足够大,根据中心极限定理,∈(t)逼近正态分布:σ2是噪声v(n)的方差。Delaunay剖分是一种特殊的三角剖分,需要满足空圆性及最大化最小内角两个准则。实现Delaunay三角剖分的算法有很多种,本专利技术采用了目前最流行的Bowyer-Watson算法。S3.所述对室内空间进行Delaunay三角剖分,采用Bowyer-Watson算法,算法的主要步骤如下:(1)构造一个超级三角形,包含所有散点,放入三角形链表;(2)将点集中的散点依次插入,在三角形链表中找出其外接圆包含插入点的三角形,称之为影响三角形,删除该影响三角形的公共边,将插入点同影响三角形的全部顶点连接起来,从而完成一个点在Delaunay三角形链表中的插入;(3)根据Lawson优化准则对局部新形成的三角形进行优化,具体步骤如下:(3.1)将两个具有共同边的三角形合成一个多边形;(3.2)以最大空圆准则作检查,看其第四个顶点是否在三角形的外接圆内;(3.3)如果在,修正对角线即将对角线对调,即完成局部优化过程的处理,将形成的三角形放入Delaunay三角形链表;(3.4)循环执行上述第(3.2)步,直到所有散点插入完毕。粒子滤波算法是一种基于蒙特卡罗和递推贝叶斯的统计滤波方法,相对其它基于滤波理论的目标跟踪算法而言,更适合应用于非线性、非高斯的运动模型。其基本思想是:使用一定范围内随机生成的粒子样本代表目标状态,通过构建目标运动模型,预测目标的实时运动情况,结合观测模型对目标状态进行估计与校正,实现目标跟踪。S4.所述采用增强粒子滤波对目标跟踪,主要包含以下四个过程:(1)粒子采样初始化粒子采样即在观测目标区域附近随机产生的M个粒子样子,利用Delaunay剖分对这些粒子进行处理,使之形成有序点集,即Delaunay三角形顶点集合V={vi|vi∈[Lx,Ly,Lz],i=1,...,M};(2)搜索阶段首先,对上一时刻得到的目标位置posritiont,Delaunay三角形顶点集合中进行搜索,判断它是否存在点集中;如果则将positiont按照Delaunay三角剖分的算法与优化步骤进行插入,新加入一个点到点集V中,并不会影响原有V集分布,且新插入点positiont只与它位置附近的点进行Delaunay准则判断,寻找与其构成De本文档来自技高网
...

【技术保护点】
1.基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,其特征在于,包括如下步骤:S1.说话人用身上佩戴的智能手机录制当前位置的语音信号,作为目标声能;S2.基于语音信号声衰模型计算目标声能特征;S3.对室内空间进行Delaunay三角剖分;S4.采用增强粒子滤波对目标跟踪,通过滤波算法对粒子初始化,结合Delaunay三角剖分结果,将粒子滤波目标跟踪框架中各阶段的范围选择问题转化为Delaunay三角锥体节点的选择问题,通过寻找上一时刻目标位置相邻的Delaunay三角形顶点集,确定当下粒子的搜索范围,得到粒子与目标之间相似度;S5.得到的每个粒子与目标的相似度,做加权平均,得到目标坐标的估计值;S6.输出目标位置3D坐标,实现移动声源的实时跟踪定位。

【技术特征摘要】
1.基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,其特征在于,包括如下步骤:S1.说话人用身上佩戴的智能手机录制当前位置的语音信号,作为目标声能;S2.基于语音信号声衰模型计算目标声能特征;S3.对室内空间进行Delaunay三角剖分;S4.采用增强粒子滤波对目标跟踪,通过滤波算法对粒子初始化,结合Delaunay三角剖分结果,将粒子滤波目标跟踪框架中各阶段的范围选择问题转化为Delaunay三角锥体节点的选择问题,通过寻找上一时刻目标位置相邻的Delaunay三角形顶点集,确定当下粒子的搜索范围,得到粒子与目标之间相似度;S5.得到的每个粒子与目标的相似度,做加权平均,得到目标坐标的估计值;S6.输出目标位置3D坐标,实现移动声源的实时跟踪定位。2.根据权利要求1所述的基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,其特征在于:S2所述基于语音信号声衰模型计算目标声能特征,具体方法如下:假设声源由人的嘴巴发出,设由嘴巴发出的语音声为s(n),手机麦克风接收到的语音信号为x(n),室内噪声为零均值的加性白噪声为v(n),则这三者的关系为:x(n)=s(n)+v(n)(1)其中,γ是手机麦克风的增益因子,a(n-τ)是由人的嘴巴所发语音的声能密度,τ是从嘴巴到手机麦克风的传输时延,ps(n-τ)是一个3*1的向量,表示嘴巴所在位置;px也是一个3*1的向量,表示手机麦克风所在位置;dsx=||ps(n-τ)-px||,设置为一个常数值;对(1)式两边计算能量均值,得到:E[x2(n)]=E[s2(n)]+E[v2(n)](3)其中上式中,g=γ2,由于假设dsx是一个常值,那么从发声位置到麦克风位置的距离很小,则τ可以忽略不计,因此,a(n-τ)≈a(n),ps(n-τ)≈ps(n),由于能量均值是在长为T的时间窗内进行的,则当采样频率为fs时,M=T*fs是用于能量平均的采样点个数;设E[x2(n)]=yx(t),E[a2(n)]=ys(t),E[v2(n)]=∈(t),则基于声衰模型的目标声能特征可表示为:yx(t)=ys(t)+∈(t)(5)其中,如果M足够大,根据中心极限定理,∈(t)逼近正态分布:σ2是噪声v(n)的方差。3.根据权利要求1所述的基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,其特征在于:S3.所述对室内空间进行Delaunay三角剖分,采用Bowyer-Watson算法,算法的主要步骤如下:(1)构造一个超级三角形,包含所有散点,放入三角形链表;(2)将点集中的散点依次插入,在三角形链表中找出其外接圆包含插入点的三角形,称之为影响三角形,删除该影响三角形的公共边,将插入点同影响三角形的全部顶点连接起来,从而完成一个点在Delaunay三角形链表中的插入;(3)根据Lawson优化准则对局部新形成的三角形进行优化。4.根据权利要求3所述的基于Delaunay三角剖分的粒子滤波声源跟踪定位方法,其特征在于:步骤(3)所述根据Lawson优...

【专利技术属性】
技术研发人员:宋浠瑜王玫仇洪冰周陬罗丽燕
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1