【技术实现步骤摘要】
水下多智能体路径规划方法、装置、计算机设备和介质
[0001]本申请涉及机器人
,特别是涉及一种水下多智能体路径规划方法
、
装置
、
计算机设备和介质
。
技术介绍
[0002]在机器人领域中,水下多智能体路径规划是研究机器人自主决策技术的重要内容
。
水下多智能体路径规划的研究内容通常包括基于单个机器人
、
固定目标位置和障碍下的水下多智能体路径规划,也包括部分动态情况下等传统水下多智能体路径规划
。
[0003]传统技术中,对机器人进行水下多智能体路径规划时,准确性较低
。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高水下多智能体路径规划准确性的水下多智能体路径规划方法
、
装置
、
计算机设备和介质
。
[0005]第一方面,本申请提供了一种水下多智能体路径规划方法
。
所述方法包括:将水下机器人当前时刻的状态空间输入预设模型,得到所述水下机器人下一时刻的速度;所述预设模型是基于预设多智能体强化学习模型及人工势场模型训练得到的;控制所述水下机器人按照所述下一时刻的速度进行移动;根据所述水下机器人当前的总移动步数
、
预设步数,控制所述水下机器人的移动路径
。
[0006]在其中一个实施例中,所述根据所述水下机器人当前的总移动步数
、
预设步数,控制所述水 ...
【技术保护点】
【技术特征摘要】
1.
一种水下多智能体路径规划方法,其特征在于,所述方法包括:将水下机器人当前时刻的状态空间输入预设模型,得到所述水下机器人下一时刻的速度;所述预设模型是基于预设多智能体强化学习模型及人工势场模型训练得到的;控制所述水下机器人按照所述下一时刻的速度进行移动;根据所述水下机器人当前的总移动步数
、
预设步数,控制所述水下机器人的移动路径
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述水下机器人当前的总移动步数
、
预设步数,控制所述水下机器人的移动路径,包括:若所述水下机器人当前的总移动步数达到所述预设步数,则控制所述水下机器人停止移动;若所述水下机器人当前的总移动步数未达到所述预设步数,且所述水下机器人到达目标点,则控制所述水下机器人停止移动;若所述水下机器人当前的总移动步数未达到所述预设步数,且所述水下机器人未到达所述目标点,则返回执行将水下机器人当前时刻的状态空间输入预设模型的步骤
。3.
根据权利要求1所述的方法,其特征在于,所述将水下机器人当前时刻的状态空间输入预设模型,得到所述水下机器人下一时刻的速度,包括:将所述水下机器人当前时刻的状态空间输入至所述预设模型中的多智能体强化学习模型中,得到所述水下机器人当前时刻的动作空间;所述动作空间包括所述水下机器人沿三个坐标轴方向的加速度
、
纵倾角加速度及偏航角加速度;根据所述人工势场模型及所述水下机器人的质量,得到所述水下机器人在所述人工势场模型下沿三个坐标轴方向的加速度;根据所述水下机器人沿三个坐标轴方向的加速度
、
所述水下机器人在所述人工势场模型下沿三个坐标轴方向的加速度,得到所述水下机器人下一时刻的速度
。4.
根据权利要求3所述的方法,其特征在于,所述根据所述人工势场模型及所述水下机器人的质量,得到所述水下机器人在所述人工势场模型下沿三个坐标轴方向的加速度,包括:根据所述水下机器人的引力场
、
斥力场
、
额外引力场,构建所述人工势场模型;根据所述人工势场模型,得到所述水下机器人在所述人工势场模型下受到的合力;根据所述合力及所述水下机器人的质量,得到所述水下机器人在所述人工势场模型下沿三个坐标轴方向的加速度
。5.
根据权利要求3或4所述的方法,其特征在于,所述根据所述水下机器人沿三个坐标轴方向的加速度及所述水下机器人在所述人工势场模型下沿三个坐标轴方向的加速度,得到所述水下机器人下一时刻的速度,包括:将所述水下机器人沿三个坐标轴方向的加速度
、
所述水下机...
【专利技术属性】
技术研发人员:任勇,李宗霖,杜军,米唯实,李劭辉,李徵,侯向往,门伟,王子源,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。