【技术实现步骤摘要】
分级多层多源融合即时接入的导航方法及系统
[0001]本专利技术涉及组合导航与智能导航的多源信息融合
,具体而言, 涉及一种分级多层多源融合即时接入的导航方法及系统。
技术介绍
[0002]当前,多源融合导航已成为学术界和工业界关注的焦点和研究热点。 由于信号传播过程中存在各种误差源、外界环境存在干扰及运动过程带来 不确定性,使得单一传感器无法在复杂动态的场景下持续提供鲁棒且准确 的导航信息。
[0003]目前常用定位方式的导航信息源,包含基于航迹推算的惯性导航器件, 基于信号接受的全球卫星定位系统和无线定位技术,基于环境感知的图像 及激光雷达等,组成多源融合导航系统可以覆盖大部分定位所需的场景, 例如室内、水上、空中、城市峡谷、地下等。因此在跨场景、多任务、多 地形、长时间的行驶过程中,通过搭载多种信息互补的导航信息源来实现 高精度和高可靠性的导航定位。
[0004]针对大范围复杂动态场景下十种及以上的导航信息源的融合方法,随 着导航信息源数量的增加,计算量呈现爆炸式增长,对于需要实时定位的 应用场景 ...
【技术保护点】
【技术特征摘要】
1.一种分级多层多源融合即时接入的导航方法,其特征在于,包括:对用于采集导航信息的多个传感器的性能进行实时评价,并基于所评价的性能通过智能方式对导航信息组合方案进行决策;采用自适应因子图的非线性融合方式,基于所述导航信息组合方案分配权重实现自适应融合,得到融合结果,并基于所述融合结果进行导航。2.根据权利要求1所述的方法,其特征在于,对用于采集导航信息的多个传感器的性能进行实时评价,并基于所评价的性能通过智能方式对导航信息组合方案进行决策包括:针对载体机动的不确定性和外界环境动态干扰的随机性,构建异常度评级准则以描述外界环境不确定性对所述多个传感器中的至少一个传感器的影响程度;基于线性时变系统的可观测度分析,计算各组合导航子滤波器状态变量的可观测度,以量化所述多个传感器中的至少一个传感器的被观测的能力;基于所述影响程度和所述可观测度,确定强化学习方法,其中,所述强化学习方法包括Q
‑
leaming算法和异步优势行动器
‑
评判器算法;根据所确定的强化学习方法构建强化学习网络,在复杂环境和运动下训练所述强化学习网络,利用所述强化学习网络对导航信息组合方案进行决策,以得到最优的导航信息组合方案。3.根据权利要求2所述的方法,其特征在于,基于所述影响程度和所述可观测度,确定强化学习方法,包括:在简单环境下,定义状态类型,采用Q
‑
leaming算法,通过设置阈值对所述多个传感器的连续变量进行分段离散化,并归一化处理,以实现控制所述多个传感器中的至少一个传感器的动作,其中,所述状态类型包括以下至少之一:辅助传感器不确定性、辅助传感器异常度、速度、GNSS状态、卫星星数和卫星信号,所述动作为开关传感器,即时收益为当前时刻位置误差的平方和的倒数;在复杂环境及运动场景下,采用异步优势行动器
‑
评判器算法,在多个线程里面分别和环境进行交互学习,训练神经网络模型,使得所述神经网络模型收敛并输出准确的估计效果,其中,输入所述神经网络模型的状态元素为所述连续变量,所述神经网络模型输出的动作为所述多个传感器中的辅助传感器的融合权值,即时收益为当前时刻位置误差的平方和的倒数。4.根据权利要求3所述的方法,其特征在于,在简单环境下,定义状态类型,采用Q
‑
learning算法,通过设置阈值对所述多个传感器的连续变量进行分段离散化,并归一化处理,以实现控制所述多个传感器中的至少一个传感器的动作,包括:接收以下至少之一的输入参数:迭代轮数,状态集,动作集,步长,衰减因子和探索率;基于所述输入参数,用∈
‑
贪婪法,基于所述状态集中的当前状态,选择出当前动作,并执行当前动作,得到新状态和奖励;基于所述新状态和所述奖励更新价值函数和状态,并基于所述价值函数和状态输出对所有状态和动作的真实价值的估计以及辅助传感器的开关。5.根据权利要求3所述的方法,其特征在于,在复杂环境及运动场景下,采用异步优势行动器
‑
评判器算法A3C,在多个线程里面分别和环境进行交互学习,训练神经网络模型,使得所述神经网络模型收敛并输出准确的估计效果,包括:
接收以下至少之一的输入参数:全局部分的神经网络参数,全局共享的迭代轮数,全局最大迭代次数,本线程的A3C神经网络结构,线程内单次迭代时间序列最大长度,状态特征维度,动作集,步长,衰减因子;基于所决策出的导航信息组合方案选择出动作并执行所述动作,得到奖励和新状态;基于所述奖励和所述新状态,计...
【专利技术属性】
技术研发人员:沈凯,李岳伦,左思琪,刘宁,朱毅晓,戚文昊,袁超杰,
申请(专利权)人:北京信息科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。