用于汽车拆解生产线的智能控制方法及系统技术方案

技术编号:34786702 阅读:23 留言:0更新日期:2022-09-03 19:48
本发明专利技术涉及智能控制技术领域,具体涉及一种用于汽车拆解生产线的智能控制方法及系统,该方法基于拆解汽车的顺序,采集每个阶段拆解前待拆解汽车的俯视图像,并获取拆解专家在拆解过程中,设定机械臂在每个阶段所对应的位姿状态向量和动作变化向量,以构成拆解专家的专家拆解轨迹;将每个阶段的俯视图像和拆解专家拆解时设定机械臂的所述位姿状态向量,通过策略网络得到待拆解汽车的AI拆解轨迹,构建AI拆解轨迹和专家拆解轨迹之间的错位熵函数,利用错位熵函数对策略网络进行迭代训练,以通过训练好的策略网络对汽车进行拆解。该方法使得智能拆解操作出现错误时,能够探索其他策略,增强策略网络的鲁棒性,保证了智能控制的拆解效果。果。果。

【技术实现步骤摘要】
用于汽车拆解生产线的智能控制方法及系统


[0001]本专利技术涉及智能控制
,具体涉及一种用于汽车拆解生产线的智能控制方法及系统。

技术介绍

[0002]随着经济的发展和汽车成本的下降,我国汽车保有量不断增大,汽车更新换代速度也更快了,因此有许多被淘汰的汽车需要进行拆解,然后回收利用不同类型、不同材质的部件。汽车拆解环节主要是为了将不同材质的零件进行拆分,便于后续分类回收利用,且拆解过程需要控制机械臂,而目前主要的拆解方法是拆解专家控制强握剪料机并使用强握剪料机进行汽车拆解。由于拆解专家的技术水平不一,导致在日常工作中拆解效率受到影响,且错误的拆解方法可能会导致事故的发生。

技术实现思路

[0003]为了解决上述技术问题,本专利技术的目的在于提供一种用于汽车拆解生产线的智能控制方法及系统,所采用的技术方案具体如下:第一方面,本专利技术实施例提供了一种用于汽车拆解生产线的智能控制方法,该方法包括以下步骤:基于拆解汽车的顺序,采集每个阶段拆解前待拆解汽车的俯视图像,并获取拆解专家在所述待拆解汽车的拆解过程中,设定机械臂在每个阶段所对应的位姿状态向量,以及设定机械臂在每个阶段的位姿变化所对应的动作变化向量,令最后一个阶段的动作变化向量中的元素都为0,将每个阶段的所述位姿状态向量和所述动作变化向量组成二元组数据,以构成拆解专家的专家拆解轨迹;将每个阶段的所述俯视图像和拆解专家拆解时设定机械臂的所述位姿状态向量,通过策略网络得到所述待拆解汽车的AI拆解轨迹,构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数,利用所述错位熵函数对策略网络进行迭代训练,以通过训练好的策略网络对汽车进行拆解。
[0004]进一步的,所述位姿状态向量的获取方法,包括:根据设定机械臂中任意一个关节的位置和姿态自由度组成对应关节的状态数据,得到所有关节的所述状态数据;获取设定机械臂的固定装置的状态,将所有关节的所述状态数据和所述固定装置的状态组成设定机械臂的所述位姿状态向量。
[0005]进一步的,所述动作变化向量的获取方法,包括:采用KDL运动学库构建设定机械臂的运动学模型,并基于TRAC

IK逆运动学求解器计算设定机械臂的末端参考轨迹所对应的关节角度序列;获取机械臂的固定装置的开合度变动程度,将所述关节角度序列和所述开合度变动程度组成所述动作变化向量。
[0006]进一步的,所述AI拆解轨迹的获取方法,包括:将第i个阶段的所述俯视图像和拆解专家在第i个阶段中的所述位姿状态向量,输
入策略网络得到第i个阶段中设定机械臂对应的AI动作变化向量,将所述AI动作变化向量和所述位姿状态向量组成第i个阶段的AI二元组数据;获取所有阶段的所述AI二元组数据,将所有的所述AI二元组数据组成所述AI拆解轨迹。
[0007]进一步的,所述构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数的方法,包括:获取当前阶段的标准机械爪状态向量和实际机械爪状态向量,所述实际机械爪状态向量是由策略网络进行智能操作下得到的,所述标准机械爪状态向量是在拆解专家的拆解过程中得到的;当所标准机械爪状态向量和所述实际机械爪状态向量之间不满足预设条件时,重新进行当前阶段的操作,直到满足预设条件或达到重做次数阈值,并计算所述标准机械爪状态向量和所述实际机械爪状态向量之间的状态差异值;当满足预设条件时,则进行下一阶段操作;获取每个阶段的所述状态差异值,由所述状态差异值构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数,所述错位熵函数的计算公式为:其中,为动作策略函数;为信息熵;为第i个阶段的动作策略;为第i个阶段的所述状态差异值;为所述错位熵函数;为阶段的总数。
[0008]进一步的,所述标准机械爪状态向量和所述实际机械爪状态向量都是由机械爪的三个角度值和四个爪的压力值组成的。
[0009]进一步的,所述预设条件为:其中,为所述标准机械爪状态向量;为所述实际机械爪状态向量;表示余弦相似度,表示同时满足两侧的条件,为任意一个,表示取绝对值,为所述标准机械爪状态向量中的第个角度值,为所述实际机械爪状态向量中的第个角度值,为所述标准机械爪状态向量中的第个压力值,为所述实际机械爪状态向量中的第个压力值。
[0010]进一步的,所述利用所述错位熵函数对策略网络进行迭代训练的方法,包括:结合所述错位熵函数和所有阶段的总奖励值,利用梯度下降法得到策略网络对拆解过程的最优策略,最优策略是指最佳AI拆解轨迹,则最优策略的计算公式为:其中,为最优策略;为总奖励值;为温度系数;为期望。
[0011]进一步的,所述总奖励值的获取方法,包括:将当前阶段中第一次重新操作得到的所述AI二元组数据作为初始二元组、最后一次重新操作的所述AI二元组数据作为最优二元组;获取每个阶段的所述最优二元组和所述初始二元组,将所有阶段的所述最优二元组构成最优AI轨迹、所有阶段的所述初始二元组构成初始AI轨迹;利用奖励函数分别获取所述最优AI轨迹的第一奖励值和所述初始AI轨迹的第二奖励值,对第一奖励值和第二奖励值进行加权求和得到所述总奖励值,所述第二奖励值的权重为所有阶段的实际重做次数总和与所有阶段的重做次数阈值总和之间的比值,所述第一奖励值的权重为1减去所述比值的结果。
[0012]第二方面,本专利技术实施例还提供了一种用于汽车拆解生产线的智能控制系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
[0013]本专利技术实施例至少具有如下有益效果:通过构建AI拆解轨迹和专家拆解轨迹之间的错位熵函数,令自动化拆解过程能够自动控制概率策略的分布,使得执行操作出现错误时,能够探索其他策略,增强了策略网络的鲁棒性,保证了智能操控的拆解效果。
附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0015]图1为本专利技术一个实施例提供的一种用于汽车拆解生产线的智能控制方法的步骤流程图。
具体实施方式
[0016]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种用于汽车拆解生产线的智能控制方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0017]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0018]下面结合附图具体的说明本专利技术所提供的一种用于汽车拆解生产线的智能控制方法及系统的具体方案。
[0019]请参阅图1,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于汽车拆解生产线的智能控制方法,其特征在于,该方法包括以下步骤:基于拆解汽车的顺序,采集每个阶段拆解前待拆解汽车的俯视图像,并获取拆解专家在所述待拆解汽车的拆解过程中,设定机械臂在每个阶段所对应的位姿状态向量,以及设定机械臂在每个阶段的位姿变化所对应的动作变化向量,令最后一个阶段的动作变化向量中的元素都为0,将每个阶段的所述位姿状态向量和所述动作变化向量组成二元组数据,以构成拆解专家的专家拆解轨迹;将每个阶段的所述俯视图像和拆解专家拆解时设定机械臂的所述位姿状态向量,通过策略网络得到所述待拆解汽车的AI拆解轨迹,构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数,利用所述错位熵函数对策略网络进行迭代训练,以通过训练好的策略网络对汽车进行拆解。2.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法,其特征在于,所述位姿状态向量的获取方法,包括:根据设定机械臂中任意一个关节的位置和姿态自由度组成对应关节的状态数据,得到所有关节的所述状态数据;获取设定机械臂的固定装置的状态,将所有关节的所述状态数据和所述固定装置的状态组成设定机械臂的所述位姿状态向量。3.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法,其特征在于,所述动作变化向量的获取方法,包括:采用KDL运动学库构建设定机械臂的运动学模型,并基于TRAC

IK逆运动学求解器计算设定机械臂的末端参考轨迹所对应的关节角度序列;获取机械臂的固定装置的开合度变动程度,将所述关节角度序列和所述开合度变动程度组成所述动作变化向量。4.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法,其特征在于,所述AI拆解轨迹的获取方法,包括:将第i个阶段的所述俯视图像和拆解专家在第i个阶段中的所述位姿状态向量,输入策略网络得到第i个阶段中设定机械臂对应的AI动作变化向量,将所述AI动作变化向量和所述位姿状态向量组成第i个阶段的AI二元组数据;获取所有阶段的所述AI二元组数据,将所有的所述AI二元组数据组成所述AI拆解轨迹。5.如权利要求4所述的一种用于汽车拆解生产线的智能控制方法,其特征在于,所述构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数的方法,包括:获取当前阶段的标准机械爪状态向量和实际机械爪状态向量,所述实际机械爪状态向量是由策略网络进行智能操作下得到的,所述标准机械爪状态向量是在拆解专家的拆解过程中得到的;当所标准机械爪状态向量和所述实际机械爪状态向量之间不满足预设条件时,重新进行当前阶段的操作...

【专利技术属性】
技术研发人员:黄绪明
申请(专利权)人:聊城一明五金科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1