一种基于量子搜索和强化学习的机器人路径规划方法、装置及介质制造方法及图纸

技术编号:43425400 阅读:27 留言:0更新日期:2024-11-27 12:37
本发明专利技术公开了一种基于量子搜索和强化学习的机器人路径规划方法、装置及介质,方法包括将真实环境和机器人状态量子化,将现实世界的环境和机器人状态动态映射到量子领域建立量子域;基于预设的量子搜索模型,利用量子叠加原理在量子域中进行搜索并获得多个搜索样本;根据机器人到达目标位置的概率,从多个搜索样本中确定一个或多个目标搜索样本;预先确定基础强化学习模型,并利用量子搜索模型和目标搜索样本对基础强化学习模型进行训练,并确定训练后的强化学习模型为机器人路径规划模型。本发明专利技术能够快速地获得高质量的目标搜索样本,可有效地减少机器人路径规划训练回合数,提高机器人路径规划的质量和速度。

【技术实现步骤摘要】

本专利技术涉及机器人路径规划领域,尤其涉及一种基于量子搜索和强化学习的机器人路径规划方法、装置及介质


技术介绍

1、随着传感器、电池以及人工智能(artificial intelligence)技术的发展,机器人已经在各种非结构化的环境中承担起重要任务,例如灾难现场救援、建筑物集群内的搜索行动、室内货物区域的包裹管理等。然而,尽管机器人在这些复杂多变的环境中能够发挥作用,但它们的适应速度仍然受到限制,主要原因在于其有限的车载计算能力和来自环境的动态干扰,比如动态障碍物和电池电量的变化等因素。这些因素导致了机器人规划的不准确性以及在紧急情况下的响应延迟。

2、强化学习(reinforcement learning,rl)是一种机器学习方法,它让智能体(如机器人)通过与环境的交互来学习如何采取行动以最大化某种累积奖励。在机器人适应动态环境方面,强化学习提供了几个关键的优势。自适应性:强化学习算法允许机器人在未知或不断变化的环境中自我学习和适应。通过试错的方式,机器人能够逐渐理解环境中的模式并学会有效地应对这些模式的变化;探索与利用的平衡:强化学习本文档来自技高网...

【技术保护点】

1.一种基于量子搜索和强化学习的机器人路径规划方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,在将机器人状态量子化过程中,对机器人状态进行编码,将机器人状态表示为量子叠加态;

3.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,将现实世界的环境和机器人状态动态映射到量子领域建立量子域,所述量子域包括量子化仿真环境、量子态参数和量子态初始化信息;

4.根据权利要求3所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,通过邻接矩阵确定机器人在真实环境中的...

【技术特征摘要】

1.一种基于量子搜索和强化学习的机器人路径规划方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,在将机器人状态量子化过程中,对机器人状态进行编码,将机器人状态表示为量子叠加态;

3.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,将现实世界的环境和机器人状态动态映射到量子领域建立量子域,所述量子域包括量子化仿真环境、量子态参数和量子态初始化信息;

4.根据权利要求3所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,通过邻接矩阵确定机器人在真实环境中的可达性并表示为以下公式:

5.根据权利要求3所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,还包括设置机器人初始时刻所在位置对应的概率值大于其它位置对应的概率值;和/或,

6.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,基于开放系统主方程,采用量子随机游走模型和经典随机游走模型构建所述量子搜索模型,所述量子搜索模型通过以下公式表示:

7.根据权利要求6所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,在所述量子化仿真环境中,机器人位于每个网格的概率由概率分布ρ的对角元素ρij所表示,其中i==j;

8.根据权利要求1所述的基于量子搜索和强化学习的机器人路径规划方法,其特征在于,通过对比机器人到达目标位置的概率从多个所述搜索样本中确定一个或多个目标搜索样,包括:

9.根据权利要求1所述的...

【专利技术属性】
技术研发人员:陆骊工占美晓黄超苏燕红刘锐
申请(专利权)人:珠海市人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1