【技术实现步骤摘要】
一种基于深度强化学习更新卡尔曼滤波器的目标追踪方法
本专利技术属于无线传感器网络中的目标追踪
,特别是一种基于深度强化学习更新卡尔曼滤波器的目标追踪方法。
技术介绍
无线传感器网络(wirelesssensornetworks,简称WSNs)是由部署在检测区域内的大量微型传感器节点组成的自组织网络,目的是智能监测与感知环境中各种参数的信息,并将数据发送至上层进行分析处理。目前WSNs已经具备了广泛的应用范围,包括移动目标的导航和控制、环境监测、机器状态监测和维护、灾难恢复和医疗保健等,而目标追踪是传感器网络的一个极其重要应用[YuG,RenF,JiY,etal.TheEvolutionofSinkMobilityManagementinWirelessSensorNetworks:ASurvey[J].IEEECommunicationsSurveys&Tutorials,2017,18(1):507-524.]。深度强化学习将深度学习的感知能力和强化学习的决策能力相结合的一种方法[刘全,翟建伟,章宗长 ...
【技术保护点】
1.一种基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,包括以下步骤:/n步骤1、利用传感器进行数据采集,获得原始追踪场景数据;/n步骤2、对原始追踪场景数据进行分类,获得不同目标追踪场景下的数据;/n步骤3、针对不同目标追踪场景下的数据,分别利用深度强化学习的方法进行多次训练直到收敛,获得最优策略π;/n步骤4、将最优策略π进行线下部署,应用到实际的追踪场景进行目标追踪。/n
【技术特征摘要】
1.一种基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,包括以下步骤:
步骤1、利用传感器进行数据采集,获得原始追踪场景数据;
步骤2、对原始追踪场景数据进行分类,获得不同目标追踪场景下的数据;
步骤3、针对不同目标追踪场景下的数据,分别利用深度强化学习的方法进行多次训练直到收敛,获得最优策略π;
步骤4、将最优策略π进行线下部署,应用到实际的追踪场景进行目标追踪。
2.根据权利要求1所述的基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,步骤1所述利用传感器进行数据采集,获得原始追踪场景数据,具体如下:
利用传感器收集目标追踪场景下的现实数据,并且对所收集的数据进行处理,清洗无效的数据。
3.根据权利要求1所述的基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,步骤2中所述获得不同目标追踪场景下的数据,包括探测信息丢失、急转弯、急加速、匀速运动。
4.根据权利要求1、2或3所述的基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,步骤3所述针对不同目标追踪场景下的数据,分别利用深度强化学习的方法进行多次训练直到收敛,获得最优策略π,具体为:
利用深度强化学习Actor-Critic算法,对步骤2所分类的不同目标追踪场景下的数据,经过多次训练直到算法收敛,得到一个最优策略π;
策略π是一个神经网路,输入为卡尔曼滤波器的预测值与传感器的测量值,输出的动作为卡尔曼滤波器的更新方法;卡尔曼滤波器根据这个最优策略选择更新方法。
5.根据权利要求4所述的基于深度强化学习更新卡尔曼滤波器的目标追踪方法,其特征在于,针对匀速运动目标追踪场景下的数据,利用深度强化学习的方法进行多次训练直到收敛,具体为:
(1)卡尔曼滤波器模型
目标的运动模型建模为:
X(t+1)=AX(t)+ω(t)
其中X(t)是目标的状态,X(t)={x(t),y(t),vx(t),vy(t)},(x(t),y(t))代表目标在不同方向上的位置,(vx(t),vy(t))代表目标在不同方向上速度;A是一个状态转移矩阵;ω(t)表示在t时刻目标的高斯白噪声,协方差矩阵为Q;
根据卡尔曼滤波得到以下更新过程:
其中是t时刻目标状态的预测值;是t-1时刻的状态估计值;P′(t)=AP(t-1)AT...
【专利技术属性】
技术研发人员:梁腾,王天誉,张杰,李骏,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。