The invention provides a machine learning device and method, a servo control device and a servo control system for complicated adjustment of the coefficients of backlash correction and accelerated backlash correction. The machine learning device (200) has: a state information acquisition unit (201), which obtains state information from the servo control device (100) by enabling the servo control device (100) to execute specified processing procedures, including at least a combination of coefficients used by the position deviation and the backlash acceleration correction unit (110); and a behavioral information output unit (203), which will adjust the signal containing the combination of coefficients contained in the state information. The behavior information including information is output to the servo control device (100); the return output unit (2021) outputs the value of the return in reinforcement learning according to the position deviation contained in the status information; and the value function updating unit (2022) updates the behavior value function according to the value, status information and behavior information of the return output unit.
【技术实现步骤摘要】
机器学习装置和方法、伺服控制装置、伺服控制系统
本专利技术涉及对执行齿隙校正控制和齿隙加速校正控制的伺服控制装置进行强化学习的机器学习装置、包含该机器学习装置的伺服控制装置、包含机器学习装置和伺服控制装置的伺服控制系统、以及机器学习方法,其中,所述强化学习是以齿隙校正控制中的齿隙校正参数和/或齿隙加速校正控制中的齿隙加速校正参数为对象的学习。
技术介绍
以往,在以将物体的位置、方位、姿势等设为控制量的控制系统,例如在机床或工业机械的控制系统中,使用了伺服电动机。在作为用于将伺服电动机的电动机轴的旋转传递至其他主轴的机械要素而相互卡合的机械要素中,在该机械要素间的接触面上有意地设置有间隙。因存在该间隙,例如螺栓或齿轮等机械要素可以在某种程度的范围内自由旋转。将该间隙称为“齿隙”(backlash)。例如,在电动机与主轴等被驱动轴通过齿轮结合时,因存在齿轮的齿隙,在电动机反转时,导致被驱动轴的反转相对于电动机的反转延迟。以往,为了校正该被驱动轴的反转延迟,存在将齿隙校正量与对电动机的位置指令相加的方法。将其称为“齿隙校正”。另一方面,有时例如因被驱动轴的静摩擦等的影响 ...
【技术保护点】
1.一种机器学习装置,其对具有齿隙校正单元和/或齿隙加速校正单元的伺服控制装置进行强化学习,其中,所述齿隙校正单元制作针对位置指令或者位置偏差的齿隙校正量,所述齿隙加速校正单元制作针对速度指令的齿隙加速校正量,所述强化学习是以所述齿隙校正单元中的齿隙校正参数和/或所述齿隙加速校正单元中的齿隙加速校正参数为对象的学习,其特征在于,所述机器学习装置具有:行为信息输出单元,其对所述齿隙校正单元和/或所述齿隙加速校正单元输出包含所述齿隙校正参数和/或所述齿隙加速校正参数的调整信息在内的行为信息;状态信息取得单元,其根据所述行为信息从所述伺服控制装置取得状态信息,所述状态信息包含使所 ...
【技术特征摘要】
2017.06.22 JP 2017-1224491.一种机器学习装置,其对具有齿隙校正单元和/或齿隙加速校正单元的伺服控制装置进行强化学习,其中,所述齿隙校正单元制作针对位置指令或者位置偏差的齿隙校正量,所述齿隙加速校正单元制作针对速度指令的齿隙加速校正量,所述强化学习是以所述齿隙校正单元中的齿隙校正参数和/或所述齿隙加速校正单元中的齿隙加速校正参数为对象的学习,其特征在于,所述机器学习装置具有:行为信息输出单元,其对所述齿隙校正单元和/或所述齿隙加速校正单元输出包含所述齿隙校正参数和/或所述齿隙加速校正参数的调整信息在内的行为信息;状态信息取得单元,其根据所述行为信息从所述伺服控制装置取得状态信息,所述状态信息包含使所述伺服控制装置执行规定的加工程序时从所述位置指令与位置反馈获得的位置偏差、所述齿隙校正参数和/或所述齿隙加速校正参数;回报输出单元,其根据所述状态信息所包含的所述位置偏差,输出强化学习中的回报的值;以及价值函数更新单元,其根据所述回报的值、所述状态信息、所述行为信息来更新行为价值函数。2.根据权利要求1所述的机器学习装置,其特征在于,在以所述齿隙校正单元中的齿隙校正参数为对象进行了强化学习之后,以所述齿隙加速校正单元中的齿隙加速校正参数为对象来进行强化学习。3.根据权利要求1或2所述的机器学习装置,其特征在于,所述回报输出单元根据所述位置偏差的绝对值来输出所述回报的值。4.根据权利要求1~3中任一项所述的机器学习装置...
【专利技术属性】
技术研发人员:猪饲聪史,中村勉,相泽智之,
申请(专利权)人:发那科株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。