伺服控制装置及系统、机器学习装置及方法制造方法及图纸

技术编号：19121236 阅读：35 留言：0更新日期：2018-10-10 04:48

提供一种伺服控制装置及系统、机器学习装置及方法，来进行能够避免复杂的高阶的速度前馈的系数的调整的强化学习。对具备根据位置指令制作速度前馈值的速度前馈计算部的伺服控制装置进行机器学习的机器学习装置具备：状态信息取得部，其通过使伺服控制装置执行预定的加工程序，从伺服控制装置取得状态信息，状态信息至少包括位置偏差、速度前馈计算部的传递函数的系数的组合；行为信息输出部，其向伺服控制装置输出包含状态信息所包括的系数的组合的调整信息的行为信息；回报输出部，其输出基于状态信息所包括的位置偏差的、强化学习中的回报的值；价值函数更新部，其根据由回报输出部输出的回报的值、状态信息及行为信息来更新行为价值函数。

全部详细技术资料下载

【技术实现步骤摘要】
伺服控制装置及系统、机器学习装置及方法
本专利技术涉及针对使用速度前馈控制的伺服控制装置，进行与速度前馈控制中的系数有关的学习的机器学习装置、包含该机器学习装置的伺服控制装置、伺服控制系统以及机器学习方法。
技术介绍
使用速度前馈控制的伺服控制装置，例如记载在专利文献1中。记载在专利文献1中的伺服控制装置对位置指令进行微分来求出位置的前馈控制量，将通过位置环(loop)控制获得的控制量加上位置的前馈控制量来作为速度指令，将对位置的前馈量进行微分得到的速度的前馈控制量加上通过速度环控制得到的值来作为电流指令。专利文献1：日本特开平3-15911号公报
技术实现思路
在伺服控制装置中，存在由于机械摩擦、机械间隙或者空转(lostmotion)等非线性特性的影响，在速度指令值发生变化时产生位置偏差的情况。在像这样的情况下，虽然通过将速度前馈设为高阶，降低了位置偏差，提高了对于位置指令的追踪性，但是速度前馈的系数(参数)的调整变难。本专利技术的目的在于，提供一种在使用速度前馈控制的伺服控制装置中，当为了降低位置偏差来提高对于位置指令的追踪性而将速度前馈的系数设为高阶时，进行能够避免复杂的速度前馈的高阶的系数的调整的强化学习的机器学习装置、包含该机器学习装置的伺服控制装置、伺服控制系统以及机器学习方法。(1)本专利技术所涉及的机器学习装置(例如，后述的机器学习装置200)其是针对具备根据位置指令制作速度前馈值的速度前馈计算单元(例如，后述的速度前馈计算部110)的伺服控制装置(例如，后述的伺服控制装置100)进行机器学习的机器学习装置，所述机器学习装置具备：状态信息取得...
伺服控制装置及系统、机器学习装置及方法

【技术保护点】
1.一种机器学习装置，其针对具备速度前馈计算部的伺服控制装置进行机器学习，所述速度前馈计算部根据位置指令制作速度前馈值，该机器学习装置的特征在于，具备：状态信息取得部，其通过使所述伺服控制装置执行预定的加工程序，而从所述伺服控制装置取得状态信息，所述状态信息包括至少包含位置偏差的伺服状态以及所述速度前馈计算部的传递函数的系数的组合；行为信息输出部，其向所述伺服控制装置输出包含所述状态信息所包括的所述系数的组合的调整信息的行为信息；回报输出部，其输出基于所述状态信息所包括的所述位置偏差的、强化学习中的回报的值；以及价值函数更新部，其根据由所述回报输出单元输出的回报的值、所述状态信息以及所述行为信息来更新行为价值函数。

【技术特征摘要】
2017.03.15 JP 2017-0496081.一种机器学习装置，其针对具备速度前馈计算部的伺服控制装置进行机器学习，所述速度前馈计算部根据位置指令制作速度前馈值，该机器学习装置的特征在于，具备：状态信息取得部，其通过使所述伺服控制装置执行预定的加工程序，而从所述伺服控制装置取得状态信息，所述状态信息包括至少包含位置偏差的伺服状态以及所述速度前馈计算部的传递函数的系数的组合；行为信息输出部，其向所述伺服控制装置输出包含所述状态信息所包括的所述系数的组合的调整信息的行为信息；回报输出部，其输出基于所述状态信息所包括的所述位置偏差的、强化学习中的回报的值；以及价值函数更新部，其根据由所述回报输出单元输出的回报的值、所述状态信息以及所述行为信息来更新行为价值函数。2.根据权利要求1所述的机器学习装置，其特征在于，所述回报输出部根据所述位置偏差的绝对值来输出所述回报的值。3.根据权利要求1或2所述的机器学习装置，其特征在于，所述回报输出部计算至少基于包含所述位置偏差以及所述位置偏差的微分值的值的回报的值。4.根据权利要求1或2所述的机器学习装置，其特征在于，所述状态信息取得部还观测从所述伺服状态所包含的速度指令值发生变化起到所述位置偏差收敛在预定的范围内为止的时间T，所述回报输出部至少根据包含所述位置偏差以及所述时间T的长度的值，来计算回报的值。5.根据权利要求1或2所述的机器学习装置，其特征在于，所述状态信息取得部还从所述伺服控制装置取得扭矩指令，所述回报输出部至少根据包含所述位置偏差以及所述扭矩指令的微分值的值，来计算回报的值。...

【专利技术属性】
技术研发人员：恒木亮太郎，猪饲聪史，园田直人，
申请(专利权)人：发那科株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人