一种基于强化学习Q学习的实时整周模糊度快速搜索方法技术

技术编号:24496039 阅读:30 留言:0更新日期:2020-06-13 03:04
本发明专利技术公开了一种基于强化学习Q学习的实时整周模糊度快速搜索方法,属于Q学习技术领域。本发明专利技术的步骤为:步骤1、设定Q学习的学习参数以及奖励矩阵;步骤2、初始化模糊度搜索过程的学习矩阵;步骤3、对于学习矩阵的每一个episode,随机选择一个初始状态;步骤4、如果没有达到目标状态,执行以下几步:1)在当前状态中的所有可能行为中选取一个行为;2)利用选定的行为,得到下一个状态;3)按照转移规则计算Q学习的学习矩阵;4)递推至下一个状态;步骤5、利用训练好的学习矩阵,就可以找出一条从任意状态到达目标状态的行为路径。本发明专利技术操作简单方便,能够实现对实时模糊度的快速搜索。

A real-time integer ambiguity fast search method based on reinforcement learning Q-learning

【技术实现步骤摘要】
一种基于强化学习Q学习的实时整周模糊度快速搜索方法
本专利技术涉及Q学习
,特别涉及一种基于强化学习Q学习的实时整周模糊度快速搜索方法。
技术介绍
随着GNSS服务领域的增加,快速获得高精度定位结果成为现有研究的热点。如何实时快速确定整周模糊度是实时载波相位观测值求解的瓶颈问题。现有的实时模糊度搜索方法多采取将搜索空间降维、采用附件条件约束搜索空间的思路,这些方法依然需要遍历待搜索空间,难以实现快速搜索。专利CN108427131A中提供了一种基线长约束下的整周模糊度快速搜索方法,引入了缩放因子的概念,对当前搜索空间大小进行自适应的缩小和方法,降低了模糊度搜索过程的耗时,在保证成功率的同时提高了搜索效率。专利CN107966718中针对现有SEVB算法在浮点模糊度解精度较差时存在搜索耗时较大问题。
技术实现思路
针对现有技术存在的缺陷与不足,本专利技术提供了一种基于强化学习Q学习的实时整周模糊度快速搜索方法,操作简单方便,能够实现对实时模糊度的快速搜索。为实现上述目的,本专利技术提供如下技术方案本文档来自技高网...

【技术保护点】
1.一种基于强化学习Q学习的实时整周模糊度快速搜索方法,其特征在于,包括如下步骤:/n步骤1、设定Q学习的学习参数以及奖励矩阵;/n步骤2、初始化模糊度搜索过程的学习矩阵;/n步骤3、对于学习矩阵的每一个episode,随机选择一个初始状态;/n步骤4、如果没有达到目标状态,执行以下几步:/n1)在当前状态中的所有可能行为中选取一个行为;/n2)利用选定的行为,得到下一个状态;/n3)按照转移规则计算Q学习的学习矩阵;/n4)递推至下一个状态;/n步骤5、利用训练好的学习矩阵,就可以找出一条从任意状态到达目标状态的行为路径:/n1)选取当前状态为初始状态;/n2)确定Q学习的行为参数,满足学习...

【技术特征摘要】
1.一种基于强化学习Q学习的实时整周模糊度快速搜索方法,其特征在于,包括如下步骤:
步骤1、设定Q学习的学习参数以及奖励矩阵;
步骤2、初始化模糊度搜索过程的学习矩阵;
步骤3、对于学习矩阵的每一个episode,随机选择一个初始状态;
步骤4、如果没有达到目标状态,执行以下几步:
1)在当前状态中的所有可能行为中选取一个行为;
2)利用选定的行为,得到下一个状...

【专利技术属性】
技术研发人员:林楠杨大兵陈刚满贵鑫周晓彬
申请(专利权)人:中国十七冶集团有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1