控制装置以及学习装置制造方法及图纸

技术编号:20175790 阅读:28 留言:0更新日期:2019-01-23 00:06
本发明专利技术涉及控制装置以及学习装置,特别是涉及使针对具有冗余自由度的机械的指令最优化的控制装置。输出具有冗余自由度的机械各轴的指令的控制装置具备学习机械各轴的指令的机器学习装置。上述机器学习装置具备:状态观测部,其将表示机械各轴的活动或者程序的执行状态的数据作为表示环境当前状态的状态变量来进行观测;判断数据获取部,其获取表示加工结果的适当与否判断结果的判断数据;学习部,其使用状态变量和判断数据,将机械各轴的活动或者程序的执行状态与机械各轴的指令关联起来进行学习。

Control devices and learning devices

The invention relates to a control device and a learning device, in particular to a control device that optimizes instructions for a machine with redundant degrees of freedom. The control device that outputs the instructions of the mechanical axes with redundant degrees of freedom has the machine learning device that learns the instructions of the mechanical axes. The machine learning device has the following parts: the state observation unit, which takes the data representing the activity of each axis of the machine or the execution state of the program as the state variable representing the current state of the environment for observation; the judgment data acquisition unit, which obtains the judgment data representing the judgment result of the processing result appropriately or not; and the learning unit, which uses the state variable and judgment data to make the judgment of each axis of the machine. The execution state of an activity or program is associated with the instructions of the mechanical axes for learning.

【技术实现步骤摘要】
控制装置以及学习装置
本专利技术涉及控制装置以及学习装置,特别是涉及使针对具有冗余自由度的机械的指令最优化的控制装置。
技术介绍
现有的控制装置所使用的加工程序通常由按照机械的轴结构的指令构成。即,现有的加工程序直接定义机械各轴的活动。因此,针对加工工件(指定工件形状)这种目的并不直观。另外,还存在以下问题:若在机械的调换时等轴结构发生变化,则加工程序也需要更新。将这种程序称为不具有冗余自由度、换言之不具有针对加工指令的轴结构的自由度的程序。为了解决上述问题,还提出了具有冗余自由度的程序的几个制作方法。例如存在以下被称为TCP(ToolCenterPointcontrol:刀具前端点控制)的技术:以工件(严格地说工作台)坐标系为基准,通过程序对刀具位置和刀具姿势(刀具方向矢量)进行指令。例如在TCP中,以下示出的形式(1)那样对刀具位置和刀具姿势进行指令。在此,X、Y、Z表示刀具前端的位置,I、J、K表示刀具姿势。轴的活动由控制装置自动地决定。X_Y_Z_I_J_K_;···(1)另外,在日本特愿2016-240446号中公开了以下技术:通过程序对从设定于机械或者工件的任意坐标系观察到的、设定于机械的任意控制点进行指令。通过使用冗余自由度,能够提高周期、加工面质量等加工性能。如果具有冗余自由度,则在预定的约束条件下能够任意地变更机械各轴的动作方法,因此,例如能够改变加减速的施加方法等。其结果是,能够改变周期、加工精度、加工面质量等。作为具有冗余自由度的机械控制技术,设计了使目的函数的解最小化的结构。在此使用的目的函数是将刀具位置等设为输入,将向机械各轴的指令值设为输出,例如使缩短周期、提高加工精度等评价基准公式化而得到的(作为一例参照日本特开2015-54393号公报)。如上所述,具有冗余自由度的机械的以往的控制技术需要评价基准的公式化。在将其应用于提高加工性能时存在以下问题。加工结果受到机械的设置环境、机械特性等各种因素的影响。这种因素是对加工结果带来较大影响的重要的因素,但是,另一方面,使对加工结果带来影响的所有因素公式化在现实中是不可能的。另外,由于并不知到控制装置与哪个机械进行组合,该机械被设置于何处,因此难以将上述因素预先包含在目的函数中。
技术实现思路
本专利技术是为了解决这种问题而完成的,其目的在于,提供使针对具有冗余自由度的机械的指令最优化的控制装置以及学习装置。本专利技术的一个实施方式所涉及的控制装置输出具有冗余自由度的机械各轴的指令,其特征在于,该控制装置具备学习上述机械各轴的指令的机器学习装置,上述机器学习装置具备:状态观测部,其将表示上述机械各轴的活动或者程序的执行状态的数据作为表示环境当前状态的状态变量来进行观测;判断数据获取部,其获取表示加工结果的适当与否判断结果的判断数据;以及学习部,其使用上述状态变量和上述判断数据,将上述机械各轴的活动或者程序的执行状态与上述机械各轴的指令关联起来进行学习。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述状态变量包括位置、速度、加速度以及加加速度中的至少一个,作为表示上述机械各轴的活动的数据。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述判断数据包括刀具的速度和位置中的至少任一个的适当与否判断结果。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述判断数据包括周期、加工精度以及加工面质量中的至少任一个的适当与否判断结果。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述学习部具备:回报计算部,其求出与上述适当与否判断结果相关联的回报;以及价值函数更新部,其使用上述回报,对表示上述机械各轴的指令相对于上述机械各轴的活动或者程序的执行状态的价值的函数进行更新。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述学习部以多层结构来运算上述状态变量和上述判断数据。本专利技术的一个实施方式所涉及的控制装置的特征在于,该控制装置还具备:决策部,其根据上述学习部的学习结果,输出表示上述机械各轴的指令的指令值。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述学习部使用从多个机械得到的上述状态变量和上述判断数据,学习上述机械各轴的指令。本专利技术的一个实施方式所涉及的控制装置的特征在于,上述机器学习装置存在于云服务器。本专利技术的一个实施方式所涉及的学习装置学习具有冗余自由度的机械各轴的指令,其特征在于,该学习装置具备:状态观测部,其将表示上述机械各轴的活动或者程序的执行状态的数据作为表示环境当前状态的状态变量来进行观测;判断数据获取部,其获取表示加工结果的适当与否判断结果的判断数据;以及学习部,其使用上述状态变量和上述判断数据,将上述机械各轴的活动或者程序的执行状态与上述机械各轴的指令关联起来进行学习。根据本专利技术,能够提供使针对具有冗余自由度的机械的指令最优化的控制装置以及学习装置。附图说明通过说明参照附图的以下的实施例,能够更加明确本专利技术的上述和其它目的以及特征。在这些图中:图1是表示具有冗余自由度的机械的控制方法的一例的图。图2是表示具有冗余自由度的机械的控制方法的一例的图。图3是表示控制装置1的一个方式的概要功能框图。图4是表示控制装置1的一个方式的概要功能框图。图5是表示机器学习方法的一个方式的流程图。图6是表示机器学习方法的一个方式的流程图。图7A是表示机器学习方法的一个方式的流程图。图7B是表示机器学习方法的一个方式的流程图。图8A是说明神经元的图。图8B是说明神经网络的图。图9是表示控制装置2的一个方式的概要功能框图。图10是表示装入控制装置的系统的一个方式的概要功能框图。图11是表示装入控制装置的系统的一个方式的概要功能框图。图12是表示装入控制装置的控制系统的一个方式的概要功能框图。具体实施方式首先,为了使本专利技术更容易理解,针对机械具有冗余自由度的情况下的控制方法,使用几个示例来说明概要。如图1所示,在具有X、Y、C轴的机械中,执行相对于设定在工件上的坐标系(以下,称为工件坐标系Σw)在X、Y轴上移动的程序。控制装置以机械坐标系Σm为基准来输出针对机械各轴的指令。在Σw的X-Y平面上执行绘制以Σm原点为中心的圆周圆的加工程序的情况下,为了实现该情况,控制装置存在许多控制机械各轴的方法。例如考虑以下(1)至(3)等的方法。(1)将Cm固定,使Xm、Ym移动。即,在工作台上的工件停止不动的状态下,通过Xm、Ym的合成使刀具进行动作来绘制圆弧。(2)将Xm、Ym固定,使Cm旋转。即,不使刀具动作而使工作台上的工件旋转。(3)使Xm、Ym和Cm交替地移动。即,使工作台、刀具两者进行动作。这些控制方法分别在加工时间、加工精度中具有差异,因此控制装置需要选择与控制目的相对应的方法,按每个控制周期向机械各轴输出指令。另外,使用旋转刀具的直行3轴、旋转3轴的机械对程序始终具有冗余自由度。如图2所示,只要不考虑行程的极限则存在许多在工件上实现刀具位置和姿势的机械各轴的位置。控制装置需要从这样存在许多的机械各轴的位置中选择一个组合,按每个控制周期向机械各轴输出指令。本专利技术提供以下方法:在这样控制具有冗余自由度的机械的情况下,例如根据加工时间优先、加工精度优先、两者的平衡重视等目的,控制装置决定各轴的最佳动作方法。<实施方式1&g本文档来自技高网
...

【技术保护点】
1.一种控制装置,其输出具有冗余自由度的机械各轴的指令,其特征在于,该控制装置具备学习上述机械各轴的指令的机器学习装置,上述机器学习装置具备:状态观测部,其将表示上述机械各轴的活动或者程序的执行状态的数据作为表示环境当前状态的状态变量来进行观测;判断数据获取部,其获取表示加工结果的适当与否判断结果的判断数据;以及学习部,其使用上述状态变量和上述判断数据,将上述机械各轴的活动或者程序的执行状态与上述机械各轴的指令关联起来进行学习。

【技术特征摘要】
2017.07.14 JP 2017-1378631.一种控制装置,其输出具有冗余自由度的机械各轴的指令,其特征在于,该控制装置具备学习上述机械各轴的指令的机器学习装置,上述机器学习装置具备:状态观测部,其将表示上述机械各轴的活动或者程序的执行状态的数据作为表示环境当前状态的状态变量来进行观测;判断数据获取部,其获取表示加工结果的适当与否判断结果的判断数据;以及学习部,其使用上述状态变量和上述判断数据,将上述机械各轴的活动或者程序的执行状态与上述机械各轴的指令关联起来进行学习。2.根据权利要求1所述的控制装置,其特征在于,上述状态变量包括位置、速度、加速度以及加加速度中的至少一个,作为表示上述机械各轴的活动的数据。3.根据权利要求1所述的控制装置,其特征在于,上述判断数据包括刀具的速度和位置中的至少任一个的适当与否判断结果。4.根据权利要求1所述的控制装置,其特征在于,上述判断数据包括周期、加工精度以及加工面质量中的至少任一个的适当与否判断结果。5.根据权利要求1所述的控制装置,其特征在于,上述学习部具备:回报计算部...

【专利技术属性】
技术研发人员:久保田彻
申请(专利权)人:发那科株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1