The invention discloses a carrying robot arm manipulation adaptive hybrid mapping learning intelligent control method and system, which comprises the following steps: Step 1: launch control robot arm repeat training grab repeatedly using the remote server to obtain a grab sample set; step 2: according to the movement of the arm power consumption of the initial training sample selection; step 3: on the basis of changes in amplitude the control value of the arm joint joint classification of initial training samples, get all kinds of joint samples; step 4: set as the final training set to establish the prediction model of vehicle joint of a robot arm control value by joint samples; step 5: input prediction model to various mobile position control of each joint position of each moving point the value of the completion of the crawling task. By establishing the mapping between the robot base, the distance between the grab table and the posture of the robot arm, the complex kinematics equation is avoided, and the accurate joint control value is obtained, and the control is flexible.
【技术实现步骤摘要】
一种运载机器人手臂操控自适应混合学习映射智能控制方法及系统
本专利技术属于机器人控制领域,特别涉及一种运载机器人手臂操控自适应混合学习映射智能控制方法及系统。
技术介绍
近些年来,移动机器人被广泛应用于室内运输,如医院利用移动机器人运输医疗设备、超市的服务型机器人、工厂制造环境下的机器人等。而机器人手臂是机器人机械系统的重要组成部分,也是机器人实现其服务功能的主要载体。机械手臂的控制问题一直是该行业的难点问题。早期,大部分手臂采用PID控制,能够实现中等以下速度的跟踪,但是在高精度、快速的场合下,传统的PID控制并不能满足其控制要求。在这种情况下,出现了模糊控制、神经网络控制、模糊神经网络控制、专家控制等智能控制方法。如今神经网络广泛应用于机器人手臂控制:通过求解运动学方程来获得训练样本,然后利用神经网络建立手臂关节空间坐标与笛卡尔空间坐标的映射关系。然而通过求解运动学方程获得大量样本的方法并不实用,而且机器人手臂关节处的电机更换会使得之前构建的神经网络需重新训练。因此,机器人的维护存在着极大的不便。基于上述原因,迫切地需要一种更为智能的手臂控制方法。
技术实现思路
...
【技术保护点】
一种运载机器人手臂操控自适应混合学习映射智能控制方法,其特征在于,包括以下步骤:步骤1:将运载机器人位于指定抓取区域内的抓取任务固定起始点,利用远程服务器控制运载机器人手臂重复进行多次抓取训练,获得抓取样本集;每个抓取样本包括运载机器人从抓取任务固定起始点移动到抓取结束点的过程中依次经过各个移动点,运载机器人在各个移动点上所有关节的控制值以及完成一次抓取任务的手臂运动耗电量;每个移动点所在位置是指运载机器人的基座与抓取台底端边缘之间的距离,相邻移动点之间间距相等;步骤2:按照手臂运动耗电量选取初始训练样本;从抓取样本集中选出手臂运动耗电量百分比低于10%的抓取样本,并从手臂 ...
【技术特征摘要】
1.一种运载机器人手臂操控自适应混合学习映射智能控制方法,其特征在于,包括以下步骤:步骤1:将运载机器人位于指定抓取区域内的抓取任务固定起始点,利用远程服务器控制运载机器人手臂重复进行多次抓取训练,获得抓取样本集;每个抓取样本包括运载机器人从抓取任务固定起始点移动到抓取结束点的过程中依次经过各个移动点,运载机器人在各个移动点上所有关节的控制值以及完成一次抓取任务的手臂运动耗电量;每个移动点所在位置是指运载机器人的基座与抓取台底端边缘之间的距离,相邻移动点之间间距相等;步骤2:按照手臂运动耗电量选取初始训练样本;从抓取样本集中选出手臂运动耗电量百分比低于10%的抓取样本,并从手臂运动耗电量百分比低于10%的抓取样本中选出手臂运动耗电量百分比最低的抓取样本作为初始训练样本;步骤3:依据各手臂关节控制值的变化幅度对初始训练样本进行关节分类,获得各类关节样本集;从初始训练样本中提取出各个关节样本,每个关节样本包括移动点位置和在对应移动点的关节控制值;依据关节控制值变化幅度a%,对初始训练样本中每个关节样本进行分类:若a%<20%,该类关节作为第一类关节;若20%≤a%≤50%,该类关节作为第二类关节;若a%>50%,该类关节作为第三类关节;每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;步骤4:利用步骤3得到的关节样本集作为最终训练集构建运载机器人手臂关节控制值的预测模型;依次将最终训练集中属于同类型关节的所有关节样本的移动点位置和在对应移动点上的关节控制值分别作为训练模型的输入数据和输出数据进行训练,构建预测模型;其中,第一类关节预测模型使用的训练模型为灰色神经网络模型;第二类关节预测模型使用的训练模型为PID神经网络模型;第三类关节预测模型使用的训练模型为广义回归神经网络模型;步骤5:当运载机器人接收到抓取指令运动到抓取任务固定起始点时,利用设定的手臂关节动作数量将抓取区域进行等间隔划分,得到各个移动点位置,依次输入各个移动点的位置到预测模型,得到各个移动点位置上的各个关节的控制值,完成将抓取任务。2.根据权利要求1所述的方法,其特征在于,所述第一类关节预测模型是以第一类关节样本集中各关节样本的移动点位置和在对应移动点上的关节控制分别作为灰色神经网络模型的输入数据和输出数据进行训练后,获得的基于灰色神经网络的第一类关节预测模型:所述基于灰色神经网络的第一类关节预测模型的输入层节点个数为2,隐含层小波元个数为4,输出层节点个数为2;训练过程中的最大迭代次数设置为500,训练学习率为0.1,阈值为0.05;所述基于灰色神经网络的第一类关节预测模型的权值和阈值采用自改进狼群算法进行寻优获得。3.根据权利要求2所述的方法,其特征在于,所述基于灰色神经网络的第一类关节预测模型的权值和阈值采用狼群算法进行寻优获得的过程如下:步骤3.1:以个体狼的位置作为基于灰色神经网络的第一类关节预测模型的权值和阈值,初始化狼群并设置狼群参数;狼群规模的取值范围为[10,100],步长因子的取值范围为[1000,2500],探狼比例因子的取值范围为[2,10],最大游走次数的取值范围为[5,20],距离判定因子的取值范围为[100,500],最大奔袭次数的取值范围为[5,15],更新比例因子的取值范围为[2,20],最大迭代次数的取值范围为[200,2000],最大搜索精度的取值范围为[0.01,0.1];步骤3.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;依次个体狼位置体对应的权值和阈值代入基于灰色神经网络的第一类关节预测模型中,并利用个体狼位置确定的基于灰色神经网络的第一类关节预测模型计算第一类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第一适应度函数f1(x);利用第一适应度函数计算每个个体狼位置的适应度,以最大适应度对应的磷虾个体位置作为初始最优头狼位置步骤3.3:探狼游走;从狼群中选取适应度最大的狼作为头狼,并随机选取探狼;计算探狼在各方向的适应度,并使探狼向适应度最大的方向探索:当某只探狼适应度大于头狼或者达到最大游走次数时,游走结束,进入步骤3.4;步骤3.4:猛狼奔袭;除头狼与探狼之外的个体狼均为猛狼,猛狼向头狼所在方向奔袭,并不断计算猛狼位置的适应度;若某猛狼位置适应度高于头狼位置适应度,则更新头狼,且其余猛狼改为向当前头狼奔袭,当猛狼与当前头狼距离小于判定距离时,该猛狼奔袭停止,当所有猛狼奔袭停止或达到最大奔袭次数时,奔袭结束,狼群进入围攻状态,进入步骤3.5;步骤3.5:除当前头狼以外所有个体狼均向头狼方向前进一步,依次判断向前进一步后的个体狼位置适应度是否优于未向前进一步的位置的适应度,若是,则将向前进一步的位置作为个体狼的新的位置,否则,若适应度降低,则个体狼保持原位置不变;步骤3.6:完成围攻行为后,狼群中所有个体狼按照当前适应度由高到低排序,适应度最高的个体狼设为头狼,排名靠后的人工狼被淘汰,并重新随机生成新的人工狼;步骤3.7:当达到最大搜索精度或最大迭代次数时,输出最新的头狼对应的基于灰色神经网络的第一类关节预测模型的最优权值和阈值,否则,令t=t+1,返回步骤3.3,继续下一次迭代。4.根据权利要求1所述的方法,其特征在于,所述第二类关节预测模型是以第二类关节样本集中各关节样本的移动点位置和在对应移动点上的关节控制值分别作为PID神经网络模型的输入数据和输出数据进行训练后,获得的基于PID神经网络的第二类关节预测模型:其中,所述基于PID神经网络的第二类关节预测模型输入层节点个数为2,隐含层个数为4,输出层节点个数为2;训练过程中,最大迭代次数设置为100,训练学习率为0.1;所述基于PID神经网络的第二类关节预测模型的权值和阈值采用水循环算法进行寻优获得。5.根据权利要求4所述的方法,其特征在于,所述基于PID神经网络的第二类关节预测模型的权值和阈值采用水循环算法进行寻优获得的过程如下:步骤5.1:将降雨层作为基于PID神经网络的第二类关节预测模型的权值和阈值,初始化降雨层种群,并设置降雨层种群参数;降雨层种群规模的取值范围为[30,150],河流和海洋的取值范围为[5,15],海洋个数1,极小值dmin的取值范围为[0.02,0.1],最大迭代次数的取值范围为[200,1000],最大搜索精度的取值范围为[0.01,0.1];步骤5.2:设定适应度函数,并确定初始最优降雨层和迭代次数t,t=1;将降雨层对应的权值和阈值代入基于PID神经网络的第二类关节预测模型中,并利用降雨层确定的基于PID神经网络的第二类关节预测模型计算第二类关节样本集中每个关节样本的关节控制预...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。