一种组合导航方法和系统技术方案

技术编号：24493895 阅读：77 留言：0更新日期：2020-06-13 02:16

本发明专利技术公开了一种组合导航方法和系统，所述方法包括下述步骤：采集并存储组合导航系统最近的特定时长内的组合导航定位数据；计算当前组合导航定位误差，判断误差是否大于阈值；若定位误差大于阈值，构建初始惯导过程噪声协方差矩阵,对过程噪声协方差矩阵进行基于强化学习的自适应估计，得到过程噪声协方差矩阵最优估计；优化预测值与量测值的相对权重，输出调整后组合导航结果。本发明专利技术能够为单个具体惯导设备提供个性化的组合导航方案，避免对先验知识的依赖；所采用的模型学习能力强，调优速度快，解决了梯度回传困难的挑战；提高组合导航系统的定位准确度，在不同环境下具有强鲁棒性。

An integrated navigation method and system

全部详细技术资料下载

【技术实现步骤摘要】
一种组合导航方法和系统
本专利技术属于导航控制
，具体涉及一种组合导航方法和系统。
技术介绍
近年来，高可靠性的自主导航系统越来越受到人们的关注。在行业需求方面，自主导航系统可用于移动测量，提供精密的定位定姿技术，为测绘行业带来革命性的变化；在大众需求方面，以智能手机，无人机，自动驾驶汽车，移动机器人为代表的智能化载体，在进行自主运动时，高度依赖精密位置信息，自主导航系统是其环境感知与决策控制的基础和核心。就自动驾驶而言，自主导航系统的市场潜力巨大。与巨大的市场潜力相对的是目前自动驾驶技术的不成熟，与其相关的精准定位技术仍有欠缺。目前定位-导航-授时(Position,Navigation,Timing,PNT)技术的重要发展方向，即为多传感器集成，多源异质信息融合。基于实时动态差分技术(Real-timeKinematic,RTK)和惯性导航系统(InertialNavigationSystem,INS)的组合导航是目前主流的室外高精度算法。为了提高在复杂场景下，RTK不可用时的定位精度，近年来学者们提出了各种自适应...

【技术保护点】
1.一种组合导航方法，其特征在于，包括下述步骤：/n步骤S1、采集并存储组合导航系统最近的特定时长内的组合导航定位数据；/n步骤S2、计算当前组合导航定位误差，判断误差是否大于阈值；/n步骤S3、若定位误差大于阈值，构建初始惯导过程噪声协方差矩阵,对过程噪声协方差矩阵进行基于强化学习的自适应估计，得到过程噪声协方差矩阵最优估计；/n步骤S4：优化预测值与量测值的相对权重，输出调整后组合导航结果。/n

【技术特征摘要】
1.一种组合导航方法，其特征在于，包括下述步骤：
步骤S1、采集并存储组合导航系统最近的特定时长内的组合导航定位数据；
步骤S2、计算当前组合导航定位误差，判断误差是否大于阈值；
步骤S3、若定位误差大于阈值，构建初始惯导过程噪声协方差矩阵,对过程噪声协方差矩阵进行基于强化学习的自适应估计，得到过程噪声协方差矩阵最优估计；
步骤S4：优化预测值与量测值的相对权重，输出调整后组合导航结果。

2.根据权利要求1所述的一种组合导航方法，其特征在于，所述步骤S1的组合导航系统为基于卡尔曼滤波构建，作为强化学习模型的环境。

3.根据权利要求1或2所述的一种组合导航方法，其特征在于，所述步骤S1的最近组合导航定位数据作为强化学习模型的训练数据，训练数据的时间长度由定位精度、训练所需时间和数据存储性能确定。

4.根据权利要求1所述的一种组合导航方法，其特征在于，所述步骤S3的过程噪声协方差矩阵由过程噪声及其变化量确定，作为强化学习模型的状态，其定义为：

其中，过程噪声wδr为位置游走系数，wδv、wq、wδkii分别速度、角度、角速率、加速度和比例误差随机游走；αk为过程噪声Wk变化量，作为强化学习模型的动作。

5.根据权利要求1所述的一种组合导航方法，其特征在于，对所述步骤S3基于强化学习的自适应估计方法是在深度确定性策略梯度DDPG基础上，以所述步骤S1的组合导航数据为输入，以过程噪声协方差矩阵最优估计为输出，包括如下步骤：
步骤S31、构造动作评估网络和值评估网络；
步骤S32、初始化两个网络的权重；
步骤S33、初始化经验池大小和每轮训练数据个数。
步骤S34、对于每一轮的每组训练数据分别计算值评价网络和动作评价网络的梯度...

【专利技术属性】
技术研发人员：罗海勇，高喜乐，包林封，宁勃坤，龚依林，肖逸敏，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人