一种基于混合推理的机动目标跟踪方法技术

技术编号:39061934 阅读:13 留言:0更新日期:2023-10-12 19:54
本发明专利技术提供一种基于混合推理的机动目标跟踪方法,该方法基于变分贝叶斯与序贯蒙特卡洛混合推理,首先根据初始的变分参数设计建议分布,对建议分布进行采样生成样本,然后利用生成的样本计算替代证据下界,最后采用随机梯度下降法对变分参数进行再优化,从而使得采样粒子和变分参数不断迭代更新。该方法将非线性状态估计与机动模型参数辨识转化为证据下界的优化问题,采用随机梯度下降法实现目标状态估计与模型参数辨识的联合优化,实现了同时进行状态估计与模型参数辨识,有效处理了非线性滤波问题,提高非线性机动目标跟踪性能,方法优点是能够适应模型参数未知的非线性动态系统。统。统。

【技术实现步骤摘要】
一种基于混合推理的机动目标跟踪方法


[0001]本专利技术属于目标跟踪领域,涉及一种基于混合推理的机动目标跟踪方法。

技术介绍

[0002]利用雷达、声呐、光电等遥感设备对目标位置进行及时、精确的连续跟踪,在远程预警、无人驾驶等领域具有十分广泛的应用。由于跟踪系统固有的非线性特性(如轨道目标的非线性运动、目标状态与传感器量测之间的非线性坐标变换等),以及非合作目标机动所引起的系统建模与实际目标运动失配等问题,严重影响跟踪系统性能,使得高精度稳定的非线性机动目标跟踪一直是雷达、声呐、光电等感知探测系统的重点和难点。非线性机动目标跟踪问题可以分解为两个子问题,即非线性滤波和自适应滤波。大多数机动目标跟踪方法采用序贯处理架构,即非线性状态估计与模型选择或参数辨识序贯处理。而这两个子问题相互耦合,即非线性滤波精度影响模型辨识精度,模型辨识不准则会影响滤波效果。联合优化框架同时进行状态估计与模型参数辨识,较序贯处理往往获得更好的性能,但求解联合后验概率密度函数面临复杂的积分问题,难以获得闭环解析解,需要寻求近似推理方法。
[0003]现有的近似推理方法主要分为两类,基于采样型的随机近似方法,如马尔科夫蒙特卡洛法MCMC、序贯蒙特卡洛SMC等;基于优化的确定性近似方法,如变分贝叶斯法VB、期望传播法EP等。这两类方法均可用于解决非线性滤波和自适应鲁棒估计问题。
[0004]基于采样型近似的MCMC、SMC可扩展性强,可以有效处理非线性问题,但仅适合于小尺度问题,当处理高维隐变量的非线性估计问题时,由于粒子数急剧增加导致计算量大。基于确定性近似的VB通过解析近似后验概率密度函数,计算量小,较MCMC更易处理大尺度问题,如高维隐变量的联合估计,但需要构建联合隐变量的共轭先验分布,且非线性问题使得标准的VB无法采用坐标上升法最大化证据下界。
[0005]基于采样型近似和确定性近似的混合推理方法,能够有效利用两种近似方法的优点,正成为国际机器学习领域的研究热点,但是在目前的研究中,该混合推理方法大部分仅应用于统计学领域。

技术实现思路

[0006]为了解决现有机动目标追踪方法中非线性滤波精度影响滤波效果、求解过程复杂的问题,本专利技术提出一种基于混合推理的机动目标跟踪方法,该方法基于变分贝叶斯与序贯蒙特卡洛推理有效处理了非线性问题,提高非线性机动目标跟踪性能,并且适用于模型参数未知的非线性动态系统。
[0007]本专利技术的技术方案是:
[0008]一种基于混合推理的机动目标跟踪方法,其特别指出在于:包括以下步骤:
[0009]步骤1:系统建模与问题描述:
[0010]步骤1.1、建立离散时间非线性动态系统模型:
[0011]x
k
=f
k
(x
k
‑1)+G
k
v
k
[0012]y
k
=h
k
(x
k
)+w
k
[0013]其中,分别代表目标状态和传感器量测,f
k
(
·
)、h
k
()分别代表非线性状态转移函数和量测函数,G
k
为过程噪声的控制矩阵,过程噪声和传感器量测噪声
[0014]均服从零均值的高斯白噪声,n
x
和n
y
分别代表系统状态x和传感器观测y的维数,下标k代表时刻;
[0015]步骤1.2、选择当目标机动时先验系统与实际系统失配的参数作为未知模型参数θ
k
,θ
k
包含:Q
k
和R
k
分别为过程噪声和传感器量测噪声协方差矩阵,和P
0|0
分别为初始状态x0的均值和方差;
[0016]步骤1.3、求解联合概率密度函数p(x
k

k
|y
1:k
),对目标状态x
k
和未知模型参数θ
k
进行联合估计;
[0017]步骤2:非线性滤波;
[0018]步骤2.1、根据初始变分参数λ1设计建议分布为r(x
k

k
;λ
k
),其中λ
k
为x
k
、θ
k
的超参数;
[0019]步骤2.2、对建议分布采样生成样本,进行粒子预测;
[0020]初始时刻k=1时,从初始建议分布r(x1;λ1)采样N个粒子,计算粒子权重
[0021]后续时刻k>1时,先对上一时刻粒子按概率进行重采样,再根据建议分布r(x
k

k
;λ
k
)生成所有粒子的一步预测,粒子权重更新为步骤2.3、利用步骤2.2生成的粒子权重,计算平滑替代证据下界和滤波替代证据下界
[0022][0023][0024]步骤2.4、采用随机梯度下降法迭代优化替代证据下界,优化目标函数为:
[0025][0026][0027]重复步骤2.2

步骤2.4,当达到迭代次数或下界收敛时终止迭代;
[0028]步骤3、目标状态估计;
[0029]根据优化后的目标参数λ
1:k
或λ
k
,重复步骤2.2,得到时间序列与当前时刻的粒子集通过粒子加权计算获得目标状态估计,即:
[0030][0031][0032]进一步地,步骤1.1中,设初始状态为x0,x0服从高斯分布,其均值和方差分别为P
0|0
,x0、v
k
和w
k
相互独立。
[0033]进一步地,步骤1.3中,在贝叶斯估计的框架下,求解联合概率密度函数p(x
k

k
|y
1:k
)方式为:给定初始值p(x0,θ0),递归执行以下两个步骤:
[0034]p(x
k

k
|y
1:k
‑1)=∫p(x
k
|x
k
‑1,θ
k
)p(θ
k

k
‑1)p(x
k
‑1,θ
k
‑1|y
1:k
‑1)dx
k
‑1dθ
k
‑1;p(x
k

k
|y
k
)

p(y
k
|x
k

k
)p(x
k

k
|y
k
‑1)。
[0035]进一步地,步骤2.2中,在后续时刻k>1,首先对上一时刻粒子以粒子权重为概率进行重采样,再对重采本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合推理的机动目标跟踪方法,其特征在于:包括以下步骤:步骤1:系统建模与问题描述:步骤1.1、建立离散时间非线性动态系统模型:x
k
=f
k
(x
k
‑1)+G
k
v
k
y
k
=h
k
(x
k
)+w
k
其中,分别代表目标状态和传感器量测,f
k
(
·
)、h
k
(
·
)分别代表非线性状态转移函数和量测函数,G
k
为过程噪声的控制矩阵,过程噪声和传感器量测噪声均服从零均值的高斯白噪声,n
x
和n
y
分别代表系统状态x和传感器观测y的维数,下标k代表时刻;步骤1.2、选择目标机动时先验系统与实际系统失配的参数作为未知模型参数θ
k
,θ
k
包含:Q
k
和R
k
分别为过程噪声和传感器量测噪声协方差矩阵,和P
0|0
分别为初始状态x0的均值和方差;步骤1.3、求解联合概率密度函数p(x
k

k
|y
1:k
),对目标状态x
k
和未知模型参数θ
k
进行联合估计;步骤2:非线性滤波:步骤2.1、根据初始变分参数λ1设计建议分布为r(x
k

k
;λ
k
),其中λ
k
为x
k
、θ
k
的超参数;步骤2.2、对建议分布采样生成样本,进行粒子预测;初始时刻,k=1:从初始建议分布r(x1;λ1)中采样N个粒子,计算粒子权重后续时刻,k>1:先对上一时刻粒子按概率进行重采样,再根据建议分布r(x
k

k
;λ
k
)生成所有粒子的一步预测,粒子权重更新为步骤2.3、利用步骤2.2生成的粒子权重,计算平滑替代证据下界和滤波替代证据下界下界下界步骤2.4、采用随机梯度下降法迭代优化替代证据下界,优化目标函数为:步骤2.4、采用随机梯度下降法迭代优化替代证据下界,优化目标函数为:重复步骤2.2

步骤2.4,当达到迭代次数或下界收敛时终止迭代;步骤3:目标状态估计;
根据优化后的目标参数λ
1:k
或λ
k
,重复步骤2.2,得到时间序列与当前时刻的粒...

【专利技术属性】
技术研发人员:兰华陈萱胡锦杰毛誉翔王增福
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1