不确定不可拆状态下的工业机器人拆解过程动态决策方法技术

技术编号：41272848 阅读：6 留言：0更新日期：2024-05-11 09:26

本发明专利技术公开了一种不确定不可拆状态下的工业机器人拆解过程动态决策方法。该方法包括：获得待拆解产品的拆解约束矩阵和连接关系矩阵，通过分析连接关系矩阵中，确定可能产生子装配体的各零件集合；按照可能产生子装配体的零件集合的组成对拆解约束矩阵进行约束关系更改，构建子装配体数据，并动态更新拆解约束矩阵；构建数字空间数字孪生模型；在数字空间和物理空间之间建立连接交互模型；通过Dueling DQN深度强化学习算法构建工业机器人拆解过程动态决策模型，获得拆解时间最优的拆解序列。本发明专利技术将物理拆解过程识别到的零件不可拆状态动态反馈至数字空间的数字孪生模型，利用Dueling DQN深度强化学习算法，实现不可拆状态下的工业机器人拆解过程动态决策。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能制造与人工智能，具体地指一种不确定不可拆状态下的工业机器人拆解过程动态决策方法。

技术介绍

1、近年来，随着科技发展以及人民经济水平的提升，促进了产品的升级与迭代，但也带来了一系列问题，例如废旧产品的回收利用等。在废旧产品的回收利用流程中，废旧产品的拆解是其中的第一步，也是极为重要的一环。拆解普遍被认为是装配的逆向过程，然而在实际拆解过程中，废旧产品中的各零件由于经过不同程度的使用，其物理属性以及几何属性都发生了变化，与新零件有着本质上的差别，为产品的拆解增加了阻力使其又明显不同于产品的装配过程。由于废旧产品的不确定性，目前的拆解主要依赖人工进行，但人工拆解存在缺乏安全性、效率低下以及成本较高等问题。

2、已有诸多研究将工业机器人装备应用于废旧产品拆解领域，结合实际情况提前对废旧产品的拆解序列进行合理的序列规划，能够大幅度减少工业机器人拆解难度以及拆解成本。

3、但是，在实际产品拆解过程中，废旧产品零件的不确定状态(损坏、缺失等)无法被预知，由于产品零件不确定状态众多，因此需要对零件不可拆状态(零件不可拆状态指的是该零件无法独立地与其物理相邻的其他零件完整分离的状态)进行研究。如果某些零件处于不可拆状态，则可能会影响其他正常零件的拆解，并且这些处于不可拆状态的零件可能会与其它受影响的零件构成子装配体，使拆解过程执行前生成的最优拆解序列无法适用于不可拆状态下的工业机器人拆解。

4、在工业机器人拆解领域中，现有技术通常使用三角模糊数或随机函数等统计表征方法描述批量废旧产品的不确定

技术实现思路

1、针对现有技术的不足之处，本专利技术提出一种不确定不可拆状态下的工业机器人拆解过程动态决策方法，针对待拆解产品中存在不确定、不可拆状态的零件，动态生成适用于当前状态下的产品零件拆解时间最优的拆解序列。

2、为达到上述目的，本专利技术所设计的一种不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特别之处在于，包括如下步骤：

3、s1)根据产品爆炸图对待拆解产品进行拆解约束分析，得到拆解约束矩阵，所述拆解约束矩阵中的元素表示待拆解产品中的两个零件之间的拆解约束关系；对待拆解产品各零件之间的连接关系进行分析，得到连接关系矩阵，通过分析连接关系矩阵中的紧密连接关系，确定可能产生子装配体的各零件集合；

4、按照可能产生子装配体的零件集合的组成对拆解约束矩阵进行约束关系更改，使该零件集合中的各零件之间能够相互约束，完成拆解约束矩阵的零件之间的约束关系修改，并在修改后的拆解约束矩阵中，将该零件集合中对应零件的行与列分别进行合并计算，生成具有约束关系的子装配体，构建子装配体数据，所述子装配体数据包括各子装配体编号、以及每个子装配体编号对应的零件构成；

5、在工业机器人拆解过程中，分析待拆解的零件，若待拆解的零件处于不可拆状态，则对待拆解产品进行子装配体分析，确定待拆解产品中子装配体编号并动态更新拆解约束矩阵，将拆解约束矩阵中的子装配体作为可供拆解的对象，动态更新待拆解产品的拆解约束；

6、s2)依据物理空间中工业机器人对待拆解产品的拆解过程，构建数字空间数字孪生模型，此过程中数字空间中的待拆解产品处于不同的零件不可拆状态，同时每一种零件不可拆状态的拆解过程生成大量的拆解过程时序数据，这些时序数据被保存并用于后续的深度强化学习算法中模型的训练，提升模型训练效率，所述拆解过程由多种拆解行为构成，用多种拆解行为的时序组合描述拆解过程，通过数字孪生模型对步骤s1)中动态更新拆解约束矩阵进行拆解序列构建；

7、s3)在数字空间和物理空间之间建立连接交互模型，所述连接交互模型将物理空间中工业机器人拆解过程中的力学数据以及待拆解产品中的各子装配体数据的识别结果传输至数字空间，将数字空间中工业机器人拆解指令传输至物理空间；

8、s4)针对待拆解产品含有不可拆状态的子装配体，通过dueling dqn深度强化学习算法构建工业机器人拆解过程动态决策模型，结合动态识别到的零件不可拆状态，获得拆解时间最优的拆解序列，针对生成的拆解时间最优的拆解序列，计算每一步拆解任务所需时间，获得工业机器人拆解产品的总拆解时间。

9、进一步地，s2)中，多种所述拆解行为包括各零件拆解工具的更换行为、各子装配体拆解工具的更换行为、工业机器人移动到产品区域中的各零件拆解点行为、工业机器人移动到产品区域中的各子装配体拆解点行为、工业机器人移动已拆解的零件至零件放置区域行为、工业机器人移动已拆解的子装配体至子装配体放置区行为、工业机器人在各零件放置区域的复位行为、工业机器人在各子装配体放置区域的复位行为、工业机器人在产品区域的复位行为。

10、更进一步地，s2)中，所述数字孪生模型从几何角度描述物理空间中工业机器人拆解过程，具体如下，根据工业机器人、拆解工具以及待拆解产品的尺寸、大小信息，在软件中制作拆解过程的3d模型，并在unity中导入调整好的3d模型，再根据物理空间中测量得到的实际数据对3d模型进行修正，在工业机器人执行拆解过程时，使参与拆解过程的物体坐标随着拆解过程而发生变化并自动更新，同时使工业机器人各关节的转角、末端坐标也随之动态更新，从而保证数字空间数字孪生模型与物理空间中工业机器人的一致性。

11、更进一步地，s2)中，若工业机器人运动过程中遇到奇点，影响数字空间中工业机器人拆解过程的正常运行，则将工业机器人全关节坐标为0时的坐标点，作为工业机器人拆解过程的复位点。

12、进一步地，s3)中，利用kr c4控制柜以及jopenshowvar在数字空间与物理空间之间建立连接交互模型，kr c4控制柜用于工业机器人的通信和控制，jopenshowvar包括用于储存数的结构体krl struct，所述krl struct包括自定义结构体cyber_info和physics_info，自定义结构体physics_info负责传输物理空间中工业机器人拆解过程中的力学数据以及待拆解产品中子装配体的识别结果，自定义结构体cyber_info负责传输工业机器人拆解指令，所述拆解指令包括拆解工具的更换指令和零件、或子装配体的拆解指令。

13、进一步地，s4)中，进行dueling dqn深度强化学习算法之前，需要构建环境模型，所述环境模型包括状态向量、动作向量、以及奖励向量，所述状态向量用于描述待拆解产品的每一步拆解信息；所述动作向量是工业机器人从当前可行拆解零件、或子装配体集合中选择每一步拆解的零件、或子装配体，所述当前可行拆解零件、或子装配体集合由动态更新拆解约束矩阵计算得到；所述奖励向量用于描述工业机器人每一步拆解效率，反应工业机器人拆解过程中的决策水平。

14、更进一步地，s4)中，所述dueling dqn深度强化学习算法具体为，在dueling 本文档来自技高网...

【技术保护点】

1.一种不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S2)中，多种所述拆解行为包括各零件拆解工具的更换行为、各子装配体拆解工具的更换行为、工业机器人移动到产品区域中的各零件拆解点行为、工业机器人移动到产品区域中的各子装配体拆解点行为、工业机器人移动已拆解的零件至零件放置区域行为、工业机器人移动已拆解的子装配体至子装配体放置区行为、工业机器人在各零件放置区域的复位行为、工业机器人在各子装配体放置区域的复位行为、工业机器人在产品区域的复位行为。

3.根据权利要求2所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S2)中，所述数字孪生模型从几何角度描述物理空间中工业机器人拆解过程，具体如下，根据工业机器人、拆解工具以及待拆解产品的尺寸、大小信息，在软件中制作拆解过程的3D模型，并在Unity中导入调整好的3D模型，再根据物理空间中测量得到的实际数据对3D模型进行修正，在工业机器人执行拆解过程时，使参与拆解过程的物体坐标

4.根据权利要求3所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S2)中，若工业机器人运动过程中遇到奇点，影响数字空间中工业机器人拆解过程的正常运行，则将工业机器人全关节坐标为0时的坐标点，作为工业机器人拆解过程的复位点。

5.根据权利要求1所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S3)中，利用KR C4控制柜以及JOpenShowVar在数字空间与物理空间之间建立连接交互模型，KR C4控制柜用于工业机器人的通信和控制，JOpenShowVar包括用于储存数的结构体KRL Struct，所述KRL Struct包括自定义结构体Cyber_Info和Physics_Info，自定义结构体Physics_Info负责传输物理空间中工业机器人拆解过程中的力学数据以及待拆解产品中子装配体的识别结果，自定义结构体Cyber_Info负责传输工业机器人拆解指令，所述拆解指令包括拆解工具的更换指令和零件、或子装配体的拆解指令。

6.根据权利要求1所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S4)中，进行Dueling DQN深度强化学习算法之前，需要构建环境模型，所述环境模型包括状态向量、动作向量、以及奖励向量，所述状态向量用于描述待拆解产品的每一步拆解信息；所述动作向量是工业机器人从当前可行拆解零件、或子装配体集合中选择每一步拆解的零件、或子装配体，所述当前可行拆解零件、或子装配体集合由动态更新拆解约束矩阵计算得到；所述奖励向量用于描述工业机器人每一步拆解效率，反应工业机器人拆解过程中的决策水平。

7.根据权利要求6所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S4)中，所述Dueling DQN深度强化学习算法具体为，在Dueling DQN神经网络中输入当前状态向量，则Dueling DQN神经网络输出待选取的动作向量，输出的待选取动作向量为最适合当前被拆解的零件、或子装配体，同时使Dueling DQN神经网络对当前状态、以及待选取动作进行评估；将Dueling DQN神经网络在训练过程中不断产生的当前状态和待选取动作存储在经验池中，当经验池中的经验数量超过阈值后，进行随机抽样，并利用抽样得到的经验集合对Dueling DQN神经网络进行训练，优化网络参数，保存最优神经网络模型，利用最优神经网络模型对含有不确定不可拆状态的待拆解产品进行拆解序列决策，生成拆解时间最优的拆解序列。

8.根据权利要求7所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：S4)中，工业机器人拆解产品的总拆解时间为

...

【技术特征摘要】

1.一种不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：s2)中，多种所述拆解行为包括各零件拆解工具的更换行为、各子装配体拆解工具的更换行为、工业机器人移动到产品区域中的各零件拆解点行为、工业机器人移动到产品区域中的各子装配体拆解点行为、工业机器人移动已拆解的零件至零件放置区域行为、工业机器人移动已拆解的子装配体至子装配体放置区行为、工业机器人在各零件放置区域的复位行为、工业机器人在各子装配体放置区域的复位行为、工业机器人在产品区域的复位行为。

3.根据权利要求2所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：s2)中，所述数字孪生模型从几何角度描述物理空间中工业机器人拆解过程，具体如下，根据工业机器人、拆解工具以及待拆解产品的尺寸、大小信息，在软件中制作拆解过程的3d模型，并在unity中导入调整好的3d模型，再根据物理空间中测量得到的实际数据对3d模型进行修正，在工业机器人执行拆解过程时，使参与拆解过程的物体坐标随着拆解过程而发生变化并自动更新，同时使工业机器人各关节的转角、末端坐标也随之动态更新，从而保证数字空间数字孪生模型与物理空间中工业机器人的一致性。

4.根据权利要求3所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：s2)中，若工业机器人运动过程中遇到奇点，影响数字空间中工业机器人拆解过程的正常运行，则将工业机器人全关节坐标为0时的坐标点，作为工业机器人拆解过程的复位点。

5.根据权利要求1所述的不确定不可拆状态下的工业机器人拆解过程动态决策方法，其特征在于：s3)中，利用kr c4控制柜以及jopenshowvar在数字空间与物理空间之间建立连接交互模型，kr c4控制柜用于工业机器人的通信和控制，jopenshowvar包括用于储存数的结构体krl struct，所述kr...

【专利技术属性】
技术研发人员：刘佳宜，徐振璐，徐文君，韩雨凝，涂小飞，张小龙，
申请(专利权)人：武汉理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人