【技术实现步骤摘要】
一种补偿结果优化方法、装置、电子设备和存储介质
[0001]本专利技术涉及机械臂控制领域,具体涉及一种补偿结果优化方法、装置、电子设备和存储介质。
技术介绍
[0002]机械臂在实际运动时,往往受诸多因素影响导致产生摩擦力以使机械臂出现运动误差,例如齿轮磨损导致机械臂的实际转速与规划转速有差异;又例如机械臂的关节处缺少润滑脂导致结构之间的摩擦阻力增加以使机械臂端部到达的实际位置与目标位置有差异。
[0003]而现有技术中往往通过在机械臂的控制系统中设置摩擦力补偿模型,通过采集大量数据训练该模型以使在控制机械臂运动时该模型能够考虑摩擦力的影响从而计算出补偿力矩,最终控制系统根据补偿力矩修正机械臂的运动,从而减少机械臂的运动误差。
[0004]然而,该摩擦力补偿模型计算所得的补偿力矩在部分时候并不可靠,例如在机械臂运动接近零速度或加速度较大时,该学习模型计算所得的补偿力矩往往超出限制以致机械臂运动出现明显偏差且造成机械臂运动的不平稳,针对该问题单纯通过对摩擦力补偿模型进行迭代训练也无法有效解决。
[000 ...
【技术保护点】
【技术特征摘要】
1.一种补偿结果优化方法,应用于机械臂的控制系统,以减少所述机械臂的运动误差,其特征在于,其步骤包括:S1.获取所述机械臂的当前时刻的规划运动数据;所述规划运动数据包括所述机械臂的每个关节的规划速度、每个所述关节的规划角度位置和每个所述关节的规划力矩;S2.获取所述机械臂的当前时刻的实际运动数据;所述实际运动数据包括所述机械臂的每个所述关节的实测速度、每个所述关节的实测角度位置和每个所述关节的实测温度;S3.将所述当前时刻的规划运动数据输入到完成训练的补偿模型中以获取当前时刻的力矩预测改正值;S4.将所述当前时刻的规划运动数据、所述当前时刻的实际运动数据和所述当前时刻的力矩预测改正值输入到完成训练的优化模型中以获取当前时刻的改正系数;S5.根据所述当前时刻的力矩预测改正值和所述当前时刻的改正系数,计算当前时刻的力矩优化改正值;S6.根据所述当前时刻的力矩优化改正值控制所述机械臂运动。2.根据权利要求1所述的补偿结果优化方法,其特征在于,所述优化模型设置有行为空间和策略函数,所述策略函数用于计算所述改正系数;所述行为空间限定了所述改正系数的第一取值范围;步骤S4中的具体步骤包括:S41.将所述当前时刻的规划运动数据、所述当前时刻的实际运动数据和所述当前时刻的力矩预测改正值代入到所述策略函数中,以使所述策略函数在所述第一取值范围中选取一个确定的值作为所述当前时刻的改正系数。3.根据权利要求2所述的补偿结果优化方法,其特征在于,根据以下步骤设置所述行为空间:S71.获取所述机械臂的历史时刻的规划运动数据;S72.将所述历史时刻的规划运动数据输入到所述完成训练的补偿模型中以获取各个历史时刻的力矩预测改正值;S73.以各个历史时刻为目标时刻,分别计算各个目标时刻的力矩预测改正值与目标时刻所需要的力矩实际改正值的比值;S74.根据各个目标时刻对应的所述比值获得所述第一取值范围。4.根据权利要求3所述的补偿结果优化方法,其特征在于,步骤S74中的具体步骤包括:S741.统计各个目标时刻对应的所述比值以得到第二取值范围;S742.对所述第二取值范围进行过滤处理以得到第三取值范围;所述过滤处理包括以第一预设占比去除所述第二取值范围的极小值和以第二预设占比去除所述第二取值范围的极大值;S743.根据所述第三取值范围获取所述第一取值范围。5.根据权利要求4所述的补偿结果优化方法,其特征在于,步骤S743中的具体步骤包括:对所述第三取值范围进行离散化处理以得到所述第一取值范围;所述离散化处理包括从所述第三取值范围中筛选出第一预设数量的具体数值;所述第一取值范围为所述具体数值的集合。
6.根据权利要求1所述的补偿结果优化方法,其特征在于,所述优化模型根据预设的奖惩规则训练得到,所述预设的奖惩规则具...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。