多机器人协同避障方法、装置和智能机器人制造方法及图纸

技术编号：30179293 阅读：20 留言：0更新日期：2021-09-25 15:41

本发明专利技术提供一种多机器人协同避障方法、装置和智能机器人，该多机器人协同避障方法包括：在执行完上一动作后，通过预设回报函数获取反馈回报；获取机器人的自身状态数据并发送至同路径任务的至少一个协同机器人，并接收至少一个所述协同机器人的协同状态数据；将所述反馈回报、所述自身状态数据以及所述协同状态数据输入至预设强化学习算法的协同避障模型，获得下一动作。本发明专利技术的多机器人协同避障方法，通过获取自身状态数据以及其它智能机器人的协同状态数据，实现多个智能机器人执行相同的路径任务时，可协同路径规划并保持协同关系，使协同避障模型的下一动作避障成功率更高，提高多个智能机器人执行相同的路径任务的效率，提高用户体验度。提高用户体验度。提高用户体验度。

全部详细技术资料下载

【技术实现步骤摘要】
多机器人协同避障方法、装置和智能机器人

[0001]本专利技术涉及机器人领域，具体而言，涉及一种多机器人协同避障方法、装置、智能机器人和可读存储介质。

技术介绍

[0002]智能机器人一般是具有感知和决策能力的个体，能够基于从环境中接收到的信息来执行相应的动作。而现有的智能机器人，一般只能执行单体的路径任务，对于多智能机器人在相同路径任务下的情况，难以做到协同避障，从而使多个智能机器人执行相同的路径任务的效率较低。

技术实现思路

[0003]鉴于上述问题，本专利技术提供了一种多机器人协同避障方法、装置、智能机器人和可读存储介质，以提高多个智能机器人执行相同的路径任务的效率，提高用户体验度。
[0004]为了实现上述目的，本专利技术采用如下的技术方案：一种多机器人协同避障方法，包括：在执行完上一动作后，通过预设回报函数获取反馈回报；获取机器人的自身状态数据并发送至同路径任务的至少一个协同机器人，并接收至少一个所述协同机器人的协同状态数据；将所述反馈回报、所述自身状态数据以及所述协同状态数据输入至预设强化学习算法的协同避障模型，获得下一动作。
[0005]优选地，所述的多机器人协同避障方法中，所述自身状态数据和所述协同状态数据包括目标点位置数据以及相应机器人的位置数据、速度数据、对应静态障碍物的位置数据、对应动态障碍物的位置数据。
[0006]优选地，所述的多机器人协同避障方法中，所述预设强化学习算法为深度确定性策略梯度法，所述协同避障模型包括值函数网络以及策略网络；所述将所述反馈...

【技术保护点】

【技术特征摘要】
1.一种多机器人协同避障方法，其特征在于，包括：在执行完上一动作后，通过预设回报函数获取反馈回报；获取机器人的自身状态数据并发送至同路径任务的至少一个协同机器人，并接收至少一个所述协同机器人的协同状态数据；将所述反馈回报、所述自身状态数据以及所述协同状态数据输入至预设强化学习算法的协同避障模型，获得下一动作。2.根据权利要求1所述的多机器人协同避障方法，其特征在于，所述自身状态数据和所述协同状态数据包括目标点位置数据以及相应机器人的位置数据、速度数据、对应静态障碍物的位置数据、对应动态障碍物的位置数据。3.根据权利要求1所述的多机器人协同避障方法，其特征在于，所述预设强化学习算法为深度确定性策略梯度法，所述协同避障模型包括值函数网络以及策略网络；所述将所述反馈回报、所述自身状态数据以及所述协同状态数据输入至预设强化学习算法的协同避障模型，获得下一动作包括：将所述反馈回报、所述自身状态数据以及所述协同状态数据输入至所述值函数网络，获得相应的评估信息；根据所述评估信息对所述策略网络进行更新运算；从更新运算后的所述策略网络获得所述下一动作。4.根据权利要求2所述的多机器人协同避障方法，其特征在于，还包括：在执行所述下一动作后，获取机器人相应的新的自身状态数据，将所述下一动作、所述新的自身状态数据、所述上一动作的所述反馈回报以及所述上一动作的所述自身状态数据关联为状态转移数据，并存储至预设的经验回放池。5.根据权利要求...

【专利技术属性】
技术研发人员：宋佳，罗雨歇，赵凯，徐小蔚，童心迪，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人