【技术实现步骤摘要】
本专利技术涉及机器人自主导航与slam(同步定位与建图),具体涉及一种基于广义非马尔可夫策略梯度的主动slam方法。
技术介绍
1、目前的主动slam方法可以分为四种方法:基于搜索的方法、基于采样的方法、信息论的方法和强化学习的方法。现有主动slam方法使机器人能够主动形成闭环,从而减少自主探索过程中累积误差的影响。
2、但现有主动slam方法存在以下缺陷:
3、(1)忽略先验信息:现有主动slam方法依赖实时传感器数据,未利用建筑平面图等先验拓扑信息,导致重复勘探与误差累积;
4、(2)马尔可夫性限制:现有主动slam方法采用基于马尔可夫的策略,无法处理依赖历史轨迹的闭环决策,导致次优轨迹选择;
5、(3)算法稳定性不足:现有主动slam方法采用的强化学习策略梯度在稀疏奖励场景下方差高,收敛困难。
技术实现思路
1、针对现有技术中的上述不足,本专利技术提供了一种基于广义非马尔可夫策略梯度的主动slam方法。
2、为了达到上述专利
...【技术保护点】
1.一种基于广义非马尔可夫策略梯度的主动SLAM方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动SLAM方法,其特征在于,在步骤S1中,环境先验图的表达式为:
3.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动SLAM方法,其特征在于,在步骤S2中,机器人姿态图的表达式为:
4.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动SLAM方法,其特征在于,在步骤S2中,结合机器人姿态图的连通性和机器人轨迹的总行程距离构建目标函数,包括以下步骤:
5.根据权利要求1所述的基于
...【技术特征摘要】
1.一种基于广义非马尔可夫策略梯度的主动slam方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动slam方法,其特征在于,在步骤s1中,环境先验图的表达式为:
3.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动slam方法,其特征在于,在步骤s2中,机器人姿态图的表达式为:
4.根据权利要求1所述的基于广义非马尔可夫策略梯度的主动slam方法,其特征在于,在步骤s2中,结合机器人姿态图的连通性和机器人轨迹的总行程距离构建目标函数,包括以下步骤:
5.根据权利要求1所述的基于广义非马尔可夫策略...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。