一种基于图神经网络和强化学习的多机器人任务规划方法技术

技术编号：39154709 阅读：12 留言：0更新日期：2023-10-23 15:00

本发明专利技术提供了一种基于图神经网络和强化学习的多机器人任务规划方法。该方法包括：基于第一深度神经网络构建单机器人焊接路径规划模型，利用单机器人焊接路径规划模型的样本数据集和第一强化学习算法对单机器人焊接路径规划模型进行训练，得到训练完成的单机器人焊接路径规划模型；基于第二深度神经网络构建多机器人任务分配模型，利用多机器人任务分配模型的样本数据集、训练完成的单机器人焊接路径规划模型和第二强化学习算法对多机器人任务分配模型进行训练，得到训练完成的多机器人任务分配模型；焊接机器人利用训练完成的多机器人任务分配模型求解所要负责焊接的焊点任务集，利用训练完成的单机器人焊接路径规划模型求解焊点的焊接顺序。型求解焊点的焊接顺序。型求解焊点的焊接顺序。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图神经网络和强化学习的多机器人任务规划方法

[0001]本专利技术涉及多机器人协作任务规划
，特别是涉及一种基于图神经网络和强化学习的多机器人任务规划方法。

技术介绍

[0002]汽车焊装是工业机器人应用的重要场景之一，整车焊装生产线具有数百台机器人进行协同焊装，多机器人焊接工艺规划与整车制造成本和生产效率息息相关。为了提高多机器人焊接的效率以及合理分配焊接任务进而提升车身制造的效率和质量，需要对位于焊接作业空间中的多个机器人以及多个焊点进行规划。然而，多机器人焊接任务分配是高度耦合的优化问题，属于NP
‑
Hard子问题。
[0003]现有技术方案中，多采用专家调优进行多机器人焊接任务规划，上述方法存在生产成本高、环境适应能力差、焊接时间长等问题。采用蚁群算法、粒子算法和遗传算法等传统智能算法也存在生产效率低等问题。

技术实现思路

[0004]鉴于上述问题，本专利技术提供了一种基于图神经网络和强化学习的多机器人任务规划方法，以期至少能够解决上述问题之一。
[0005]根据本专利技术的实施例，提供了一种基于图神经网络和强化学习的多机器人任务规划方法，包括：分别生成用于单机器人焊接路径规划模型和多机器人任务分配模型训练的样本数据集，其中，样本数据集中包括焊接机器人的位置坐标和焊点的位置坐标；基于第一深度神经网络构建单机器人焊接路径规划模型，利用单机器人焊接路径规划模型训练的样本数据集和第一强化学习算法对单机器人焊接路径规划模型进行训练，得到训练完成的单机器人...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络和强化学习的多机器人任务规划方法，其特征在于，包括：分别生成用于单机器人焊接路径规划模型和多机器人任务分配模型训练的样本数据集，其中，所述样本数据集中包括焊接机器人的位置坐标和焊点的位置坐标；基于第一深度神经网络构建所述单机器人焊接路径规划模型，利用所述单机器人焊接路径规划模型训练的样本数据集和第一强化学习算法对所述单机器人焊接路径规划模型进行训练，得到训练完成的单机器人焊接路径规划模型；基于第二深度神经网络构建所述多机器人任务分配模型，利用所述多机器人任务分配模型训练的样本数据集、所述训练完成的单机器人焊接路径规划模型和第二强化学习算法对所述多机器人任务分配模型进行训练，得到训练完成的多机器人任务分配模型；焊接机器人利用所述训练完成的多机器人任务分配模型求解所要负责焊接的焊点任务集，并利用所述训练完成的单机器人焊接路径规划模型求解焊点的焊接顺序。2.根据权利要求1所述的方法，其特征在于，所述分别生成用于单机器人焊接路径规划模型和多机器人任务分配模型训练的样本数据集包括：在预设尺度的三维空间中生成多组样本数据集，每组所述样本数据集包括个节点坐标，定义个焊接机器人对应的节点标号为，坐标为，定义个焊点对应的节点标号为，坐标为，其中，、以及均为正整数；其中，用于所述单机器人焊接路径规划模型训练的样本数据集中，所述焊接机器人的个数。3.根据权利要求1所述的方法，其特征在于，所述基于第一深度神经网络构建所述单机器人焊接路径规划模型包括：所述第一深度神经网络采用第一编码器
‑
第一解码器结构，其中，第一编码器包含一个图注意力网络，第一解码器包含一个策略网络，所述策略网络由多头注意力层和单头注意力层组成。4.根据权利要求3所述的方法，其特征在于，所述第一编码器执行以下功能：将单机器人焊接路径规划训练的样本数据集作为第一编码器的输入，利用所述图注意力网络输出所述单机器人焊接路径规划训练的样本数据集中每个节点的特征向量；其中，所述第一解码器执行以下功能：将所述单机器人焊接路径规划训练的样本数据集中所有节点的特征向量的最大值作为全局嵌入向量，并将所述单机器人焊接路径规划训练的样本数据集中每个节点的特征向量和所述全局嵌入向量作为所述第一解码器的输入，利用所述第一解码器的策略网络输出所述单机器人焊接路径规划训练的样本数据集中每个焊点被焊接机器人访问的概率；将所述焊点被所述焊接机器人访问的概率由大到小排序，所述焊接机器人依据所述排序对焊点依次进行焊接操作。5.根据权利要求1所述的方法，其特征在于，所述利用所述单机器人焊接路径规划模型训练的样本数据集和第一强化学习算法对所述单机器人焊接路径规划模型进行训练，得到训练完成的单机器人焊接路径规划模型包括：根据预设的第一损失函数和预设的第一奖励函数，利用所述单机器人焊接路径规划模型训练的样本数据集并通过带基准的第一强化学习算法对所述单机器人焊接路径规划模
型进行训练，直到满足预设的第一训练迭代次数，得到所述训练完成的单机器人焊接路径规划模型。6.根据权利要求5所述的方法，其特征在于，所述第一损失函数如公式（1）所示：（1），其中，为累积奖励，为基准函数，为状态下采取策略的概率，表示所述单机器人焊接路径规划...

【专利技术属性】
技术研发人员：穆朝絮，张俊楠，刘朝阳，李海星，缪志强，徐娜，姜泽武，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人