发现时间系列中的预兆子序列的方法和系统技术方案

技术编号:21855421 阅读:29 留言:0更新日期:2019-08-14 01:37
确定表示机器的运行的时间系列数据中的模式的系统和方法。存储器存储和提供由机器的传感器生成的一组训练数据例,其中,每个训练数据例表示机器在以机器故障为结束的时段内的运行。处理器被配置成将每个训练数据例迭代地划分成正常区域和异常区域,确定正常区域中不存在并且仅在每个异常区域中出现一次的预测模式,并且确定异常区域的长度。经由与处理器通信的输出接口输出预测模式或者将预测模式存储在存储器中,其中,预测模式是对即将发生的故障的预测估计并帮助管理机器。

Methods and Systems for Discovering Precursor Subsequences in Time Series

【技术实现步骤摘要】
【国外来华专利技术】发现时间系列中的预兆子序列的方法和系统
本公开总体上涉及设备故障的检测和预测,并且具体地说,使用时间系列数据来检测和/或预测机器故障。
技术介绍
现代计算机系统从各种物理系统收集大量信息。这些物理机器通常经受按规则工作周期组织的重复负载,并且往往会以一种或多或少的常规模式磨损,由于部分或完全破损而逐渐达到它们故障时的状态。保持这些机器处于良好的工作状态是与其运行相关的重要任务,并且如何以及何时执行维护对其运行的经济方面具有非常显著的影响。一种维护策略是仅在机器发生故障后进行修理(也称为纠正性维护)。这种策略往往不是最优的,因为整个故障机器的修理可能比在机器中断之前更换单个部件更昂贵,并且机器故障也可能导致材料浪费,不可接受的产品质量,甚至可能危及操作机器的人员。在纠正性维护不可行或经济选择的情况下,使用不同的策略-以固定间隔(例如,一年)定期维护机器。这种以安全为关键的机器的例子是电梯和汽车;在世界上大部分地区,它们的维护每年进行一次,并且颁发对应证书。这种策略通常称为预防性维护。
技术实现思路
[技术问题]尽管预防性维护解决了与机器维护相关联的安全问题,但在许多情况下,其在经济上不是最佳的。预防性维护的第一个问题是维护周期的长度通常是任意的(例如,一年或一个月),并且更多的是有关检查机构的便利性和检查过程的后勤工作(例如,发布汽车检查标签),而不是机器的实际需要。第二个问题是单个维护周期对于一组机器中的所有机器来说可能不是最佳的,其中一些机器是新的并且可能不需要经常需要,而旧机器可能需要更频繁的维护。在机器分析行业,通常将传感器用于测量机器参数。随着机器操作仪表化的增加,从监测机器运行的传感器收集大量数据。来自一些传感器的数据也可能以相对较高的频度生成,这进一步导致大量数据。可以分析来自与机器相关联的传感器的数据流以确定机器的状态。例如,在一些情况下,可以分析来自与机器相关联的传感器的数据流以确定机器是否未按预期执行(这被称为设备故障)。无法快速处理来自传感器的数据可能导致信息丢失,这些信息可能指示或预测机器故障。因此,本领域需要一种从大量数据中检测和/或预测机器故障的改进方法。本公开的一些实施方式基于如下认识:最普遍地,通过在可以对机器故障进行预测时的当前时刻之前的任何时间观测的信息,可以指示机器的状况。这可以包括在当前时刻或之前的任何时刻的任何观测变量的任何传感器读数,并且另外包括任何有序或无序的、连续或非连续的一组这样的读数。例如,本公开的实施方式包括在时间系列中发现具有关于将来事件(如机器的故障)的最大预测力的子序列。我们的认识包括至少一个假设,即,在事件发生之前的某个时间,该时间系列的特征将作为即将发生的事件的前兆而改变。这种变化可能被表达为出现之前未见过的一个或更多个子序列,我们将其识别为“预测模式”。在解决检测和预测机器故障的问题时,必须克服几个挑战。例如,首先发现分析可能条件描述的整个空间是一项计算繁重的任务,而且,该空间中的许多可能条件描述符不太可能对应于可能指示将来故障的典型早期警告信号。基于此,需要将条件描述符的空间限制为较小的子空间。在限制条件描述符的空间时,首先将条件描述符表示为一个或更多个观测变量的时间滞后窗口,并且窗口长度固定。如果采用这种固定长度的描述符,那么可以根据收集的历史数据构建训练数据集,其中该训练集中的每个例子包含输入矢量,该输入矢量对应于来自该时间系列中的时间点的选择条件描述符,并且标量输出变量是该时间故障之前的时间。然后可以通过利用机器学习算法来处理训练例的这种格式。然而,我们面临着第二个挑战,即,为了应用固定长度的描述符,需要知道时间窗口的正确大小,而这是未知的。我们发现,尝试确定时间窗口的正确大小是一项比我们想象的更难克服的任务。因为通过拟合单独的预测模型来尝试所有可能的大小在计算上是不实际的,而且,尚不清楚如何比较所有模型的预测准确度以便确定最好的一个。我们通过实验认识到,如果分析了哪些模式在时间系列的正常区段中没有出现,但确实发生在接近故障的区段中,即,异常时间系列,那么时间系列中的模式可以高度预测将来的故障。本公开的方法和系统使观测到的从候选模式到正常时间系列的最接近距离与观测到的候选模式到异常时间系列的最接近距离之间的间隔(margin)最大化。后处理步骤消除了在正常运行期间可能自然发生的重复模式。换句话说,基于我们的认识,可以从故障时刻开始迭代地搜索异常区域,每次迭代都能够将特定划分定义成正常区域/异常区域。例如,针对每次迭代,可以应用小形(Shapelet)发现算法来搜索预测模式,直到发现最佳预测模式。使用小形发现算法的至少一个优点是获取不同长度的预测模式的有效搜索。在内部,小形发现算法根据预定测量标准来优化预测模式,例如,预测模式应当尽可能与异常区域中的一个模式相似并且尽可能与正常区域中的所有模式不同。然而,对于这样的测量标准,我们发现搜索正确长度的正常区域的过程受限,因为其总是试图最小化正常区域的长度,因为较小的正常区域不太可能包括预测模式(空的正常区域根本不包括模式)。我们注意到,如果不正确地选择了正常区域,那么预测模式可以完美地表征正常行为。因此,为了克服这个其它限制,我们认识到,一种解决方案是在测量标准中增加预测模式应当仅存在于异常区域中一次的条件。这允许我们在时间系列中发现具有关于将来事件(如故障等)的最大预测力的子序列。[问题的解决方案]根据本公开实施方式,提供了一种确定表示机器运行的时间系列数据中的模式的系统。所述系统包括与所述机器通信的传感器以及输出接口。计算机可读存储器存储和提供由与所述机器通信的所述传感器生成的一组训练数据例。其中,每个训练数据例表示所述机器在以所述机器故障为结束的时段内的运行。与所述计算机可读存储器通信的处理器被配置成将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域。所述处理器还确定所述正常状态区域中不存在并且仅在每个异常状态区域中出现一次的预测模式,并且确定所述异常状态区域的长度。其中,每次迭代包括:(1)选择每个训练数据例内的所述异常状态区域的当前时间系列长度,该当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器故障时刻结束。其中,每次迭代,所述当前时间系列长度从时间系列开始到所述机器故障结束被缩短一个时间步长的增量,使得所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;(2)将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;(3)识别所述一组训练数据例中的模式,使得该模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,并且类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;并且(4)如果发现该模式,则选择该模式作为所述预测模式。最后,经由与所述处理器通信的输出接口输出所述预测模式或者将所述预测模式存储在所述计算机可读存储器中,其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。根据本公开另一实施方式,提供了一种在表示机器的运行的时间系列数据中确定模式的方法。所述方法包括:访问存储在计算机可读存本文档来自技高网...

【技术保护点】
1.一种确定表示机器的运行的时间系列数据中的模式的系统,该系统包括:与所述机器通信的传感器;输出接口;计算机可读存储器,该计算机可读存储器存储和提供由与所述机器通信的所述传感器生成的一组训练数据例,其中,每个训练数据例表示所述机器在以所述机器的故障为结束的时段内的运行;与所述计算机可读存储器通信的处理器,该处理器被配置成将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域,确定所述正常状态区域中不存在并且仅在各个异常状态区域中出现一次的预测模式,并且确定所述异常状态区域的长度,其中,对于每次迭代,所述处理器被配置成:选择每个训练数据例内的所述异常状态区域的当前时间系列长度,所述当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器发生故障的时刻结束,其中,对于每次迭代,从时间系列的起点开始到所述机器故障结束,使所述当前时间系列长度按如下方式缩短一个时间步长的增量:所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;按照如下方式识别所述一组训练数据例中的模式:所述模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;以及如果发现所述模式,则选择所述模式作为所述预测模式;以及经由与所述处理器通信的输出接口输出所述预测模式,或者将所述预测模式存储在所述计算机可读存储器中,其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。...

【技术特征摘要】
【国外来华专利技术】2016.12.12 US 15/375,4731.一种确定表示机器的运行的时间系列数据中的模式的系统,该系统包括:与所述机器通信的传感器;输出接口;计算机可读存储器,该计算机可读存储器存储和提供由与所述机器通信的所述传感器生成的一组训练数据例,其中,每个训练数据例表示所述机器在以所述机器的故障为结束的时段内的运行;与所述计算机可读存储器通信的处理器,该处理器被配置成将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域,确定所述正常状态区域中不存在并且仅在各个异常状态区域中出现一次的预测模式,并且确定所述异常状态区域的长度,其中,对于每次迭代,所述处理器被配置成:选择每个训练数据例内的所述异常状态区域的当前时间系列长度,所述当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器发生故障的时刻结束,其中,对于每次迭代,从时间系列的起点开始到所述机器故障结束,使所述当前时间系列长度按如下方式缩短一个时间步长的增量:所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;按照如下方式识别所述一组训练数据例中的模式:所述模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;以及如果发现所述模式,则选择所述模式作为所述预测模式;以及经由与所述处理器通信的输出接口输出所述预测模式,或者将所述预测模式存储在所述计算机可读存储器中,其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。2.根据权利要求1所述的系统,其中,所述异常状态区域对应于所述机器无法正常运行并最后导致所述机器发生故障,并且所述异常状态区域的所述当前时间系列长度是所述一组训练数据例中的各个训练数据例的所述异常状态区域内的离散时间数据的量。3.根据权利要求1所述的系统,其中,如果所述预测模式与所述正常区域中的模式之间的欧几里德距离超过预先指定的阈值,则所述预测模式与所述正常区域中的模式不同。4.根据权利要求1所述的系统,其中,如果所述预测模式与所述正常区域中的模式之间的欧几里德距离低于预先指定的阈值,则所述预测模式与所述正常区域中的模式被视为是相似的。5.根据权利要求1所述的系统,其中,搜索所述预测模式的操作是通过快速小形发现算法来执行的。6.根据权利要求1所述的系统,其中,所述处理器基于标识所述一组训练数据例中的每个训练数据例的、在所述机器正常运行时由所述机器的所述传感器生成的部分的数据,将所述训练数据例划分成所述正常状态区域,并且基于标识所述一组训练数据例中的每个训练数据例的、在所述机器无法正常运行并且最后导致所述机器发生故障时由所述机器的所述传感器生成的部分的数据,将所述训练数据例划分成所述异常状态区域。7.根据权利要求1所述的系统,其中,与所述处理器和所述计算机可读存储器通信的用户接口在接收到来自所述用户接口的表面的用户输入时,取得所述一组训练数据例并且将所述一组训练数据例存储在所述计算机可读存储器中。8.根据权利要求1所述的系统,其中,所述一组训练数据例的所述时段是以下之一:相同的时段,或者所述一组训练数据例中的一些训练数据例具有与所述一组训练数据例中的其它训练数据例的时段不同的时段。9.根据权利要求1所述的系统,所述系统还包括:从与第二机器通信的传感器接收测试数据例,并将所述测试数据例存储在所述计算机可读存储器中;由所述处理器基于所述计算机可读存储器中的至少一个存储的预测模式,确定从所述测试数据例中提取的一个或更多个测试数据段是否标识所述第二机器的、与所述计算机可读存储器中的所述至少一个存储的预测模式相对应的模式;如果发现所述模式,则选择所述模式作为第二预测模式;以及将所述第二预测模式存储在所述计算机可读存储器中,或者经由与所述处理器通信的输出接口输出所述第二预测模式,其中,所述第二预测模式有助于管理所述第二机器。10.根据权利要求9所述的系统,其中,所述第二机器与所述机器相似,并且所述第二机器的传感器测量与所述机器的传感器中的相应传感器相同的参数。11.根据权利要求10所述的系统,其中,各个参数涉及所述机器的运行,所述参数包括以下项中的一个或组合:流体力数据、流体能量数据、振动数据、温度数据、电压数据或电流数据。12.根据权利要求9所述的系统,其中,所述第二机器的所述测试数据例具有与所述机器的所述一组训练数据例中的每个训练数据例相同的时段,或者所述第二机器的所述测试数据例具有与针对所述机器的所述一组训练数据例中的每个训练数据例的规则采样率相同的采样率。13.一种确定表示机器的运行的时间系列数据中的模式的方法,该方法包括:访问存储在计算机可读存储器中的、由与所述机器通信的传感器生成的一组训练数据例,其中,每个训练数据例表示所述机器在以所述机器的故障为结束的时段内的运行;通过所述计算机将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域,确定所述正常状态区域中不存在并且仅在每个异常状态区域中出现一次的预测模式,并且确定所述异常状态区域的长度,其中,每次迭代包括:选择每个训练数据例内的所述异常状态区域的当前时间系列长度,所述当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,...

【专利技术属性】
技术研发人员:D·N·尼科夫斯基朱彦AM·法拉赫曼德
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1