检测异常数据点的系统、设备和方法技术方案

技术编号:37421757 阅读:16 留言:0更新日期:2023-04-30 09:44
公开了检测与工业环境(610)相关联的操作数据(U)中的至少一个异常数据点的系统、设备和方法。该方法包括将一个或多个异常检测模型(fi)迭代地应用于操作数据(U)的至少一个子集(S),其中基于由被标记为正常的数据点组成的训练数据集(L)来训练异常检测模型(fi);使用异常检测模型(fi)将该子集(S)中的子集

【技术实现步骤摘要】
【国外来华专利技术】检测异常数据点的系统、设备和方法


[0001]本专利技术涉及检测与工业环境相关联的操作数据中的异常数据点。

技术介绍

[0002]异常检测通常需要被训练以检测工业资产的使用或操作方面的异常检测模型。例如,马达故障检测依赖于用故障特定特征训练的模型,该故障特定特征基于领域专家对来自马达变频器的测量操作数据的知识而生成。操作数据可以被测量为时间序列,其中来自特定传感器的数据来自例如以特定频率对马达变频器进行采样。在一些情况下,操作数据可以是分批存储和分析的时间序列数据。模型和阈值可能需要在每种操作条件的正常和故障情况下对马达数据进行训练。为了减少训练努力,可以使用人工智能技术。
[0003]现有的异常检测模型可能集中在检测将来具有大量可用于训练的正常数据(仅一个类别)的异常数据点。此外,现有的人工智能技术可以集中在将来对数据进行分类,而只有少数的多类训练数据可用。因此,人工智能技术可能需要具有大量预标记数据的训练数据集。然而,具有大量未标记的数据点和仅少数被标记为正常或异常的数据点的学习技术不能有效地检测异常或异常数据点。此外,对验证异常数据点检测的专家的依赖可能增加。

技术实现思路

[0004]因此,用于检测异常数据点的系统、设备和方法可以受益于改进。本专利技术的目的是有效地检测与工业环境相关联的操作数据中的异常数据点。尤其是,本专利技术的目的是能够检测大量未标记数据集中的异常数据点。
[0005]该目的通过检测与工业环境相关联的操作数据中的至少一个异常数据点的预测性维护系统、计算设备和方法来实现。
[0006]例如,检测与工业环境相关联的操作数据中的至少一个异常数据点的方法,其中该操作数据包括对应于工业资产在工业环境中的操作的历史数据和流数据,该方法包括将一个或多个异常检测模型应用于操作数据的至少一个子集,其中基于由标记为正常的数据点组成的训练数据集来训练异常检测模型;使用该异常检测模型将该子集中的子集

数据点分类为正常数据点和异常数据点中的一者;至少利用该正常数据点更新该训练数据集;在阈值时间期满之后用该更新的训练数据集来重新训练该异常检测模型,其中该阈值时间基于对该训练数据集的更新次数;以及使用该异常检测模型检测该工业环境中的该至少一个异常数据点。
[0007]在一个实施例中,检测与工业环境相关联的操作数据中的至少一个异常数据点的方法可以包括迭代地将一个或多个异常检测模型应用于该操作数据的至少一个子集,其中基于由标记为正常的数据点组成的训练数据集来训练该异常检测模型;使用该异常检测模型将该子集中的子集

数据点迭代地分类为正常数据点和异常数据点中的一者;至少利用被分类为正常的数据点迭代地更新训练数据集;迭代应用该异常模型、分类和数据集更新以用于该完整操作数据或直到达到阈值时间;在该阈值时间期满之后用该更新的训练数据
集来重新训练该异常检测模型,其中该阈值时间基于对该训练数据集的更新次数;以及通过开始新的迭代,使用该异常检测模型来检测该工业环境中的至少一个异常数据点。因此,本专利技术包括异常检测模型的分类、更新和重新训练的迭代继续。
[0008]在另一个示例中,用于检测与工业环境相关联的操作数据中的至少一个异常数据点的计算设备,其中该操作数据包括对应于该工业环境中的工业资产的操作的历史数据和流数据,该设备包括处理单元;和可由该处理单元执行的异常模块,该异常模块包括计算机可读指令,当由该处理单元执行时,该异常模块被配置为执行在本文公开的方法中的一者中的步骤。
[0009]在又一个示例中,用于工业环境的预测性维护系统包括本文所公开的计算设备。
[0010]另一个示例包括计算机程序产品,该计算机程序产品包括计算机可读代码,当在处理器上执行该计算机可读代码时,该计算机可读代码执行本文的一种或多种方法的方法步骤中的任何一者。
[0011]本专利技术有利地结合了半监督学习和异常检测。因此,即使存在少量正常数据点和大量未知数据点,也可以检测异常数据点。此外,本专利技术提供了可以在在线学习流水线中执行的工作流。该工作流使得能够从未标记和标记的数据点连续学习并自动升级异常检测模型。因此,本专利技术具有为工业环境生成和维护鲁棒的异常检测模型和学习流水线的技术效果。
[0012]在更详细地描述所建议的惯例之前,应当理解,在本专利文件中提供了对某些词语和短语的各种定义,并且本领域的普通技术人员将理解,这些定义在许多(如果不是大多数)示例中适用于这些定义的词语和短语的先前以及未来使用。虽然一些术语可包括多种实施例,但所附权利要求书可明确地将这些术语限制于特定实施例。还应当理解,在建议的方法的上下文中解释的特征也可以通过适当地配置和调整系统而被建议的系统包括,反之亦然。
[0013]如本文所用,“工业环境”是指可半自动或全自动制造的设施。工业环境可以是自动化环境的一部分。例如,工业自动化环境、实验室自动化环境、建筑物自动化环境等。此外,根据本专利技术,自动化环境可以包括一个或多个工业自动化环境、实验室自动化环境、建筑物自动化环境的组合。
[0014]工业资产可以是包括物理设备和可用于配置和控制物理设备的数字模型的控制设备、传感器、致动器。例如,计算机数字控制(CNC)机器、工业生产设施中的自动化系统、马达、发电机等。工业资产也可以被称为信息物理系统,因为它包括信息物理设备。
[0015]本文使用的“操作数据”是与工业资产的操作和操作条件相关联的数据。可以从不同的源(例如,传感器、用户设备等)接收操作数据。传感器测量与资产相关联的操作参数。例如,传感器可以包括热成像设备、振动传感器、电流和电压传感器等。术语“操作参数”是指资产的一个或多个特性。因此,操作数据是与资产的操作相关联的操作参数的度量。例如,操作数据可以包括表示与工业资产(例如,工业环境中的马达或转子)相关联的振动、温度、电流、磁通量、速度、功率的数据点。
[0016]可以实时接收和分析操作数据。此类操作数据可以称为流数据。本文使用的“流数据”是指以时间序列接收的数据点。例如,流数据包括马达的振动传感器的时间序列传感器值。在另一个示例中,操作数据可作为批量被接收和存储。操作数据可以称为“历史数据”。
例如,历史数据包括一个月内来自马达的振动传感器值。如在本文使用的,“异常检测模型”是指从用于工业资产和/或工业环境的基于物理学的模型和/或数据驱动的模型生成的一个或多个模型。例如,异常检测模型可以包括具有工业资产的本体数据的基于本体的模型、具有与基于条件的概率相关联的概率数据的预测模型。在一个实施例中,工业资产的本体数据用于基于本体模型中资产属性和它们之间相互依赖性来检测异常。在另一个实施例中,异常检测模型包括滑动窗口计算、傅立叶变换、应用低/高通滤波器、神经网络、决策树分析和在数字信号处理、机器学习和自动化工程领域中公知的其他技术。
[0017]基于该训练数据集来训练该异常检测模型。训练数据集最初包括标记为正常的数据点。因此,当异常检测模型被应用于操作数据的子集时,可以分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种检测与工业环境(610)相关联的操作数据(U)中的至少一个异常数据点的方法,其中所述操作数据(U)包括与所述工业环境(610)中的工业资产(612

618)的操作对应的历史数据和流数据,所述方法包括:将一个或多个异常检测模型(fi)应用于所述操作数据(U)的至少一个子集(S),其中基于由被标记为正常的数据点组成的训练数据集(L)来训练所述异常检测模型(fi);使用所述异常检测模型(fi)将所述子集(S)中的子集

数据点分类为正常数据点(N)和异常数据点(A)中的一者;至少利用所述正常数据点来更新所述训练数据集;在阈值时间期满之后用所更新的训练数据集重新训练所述异常检测模型(fi),其中所述阈值时间基于对所述训练数据集的更新的次数;以及使用所述异常检测模型(f

i)检测所述操作数据(U)中的所述至少一个异常数据点。从所述操作数据(U)中移除所述子集;使用重新训练的异常检测模型(fi)检测不含所述子集的剩余操作数据(U)中的所述至少一个异常数据点;将所述重新训练的异常检测模型(fi)应用于所述操作数据(U)的新子集,并将所述新子集中的新数据点分类为所述正常数据点(N)和所述异常数据点(A)中的一者;以及更新所述训练数据集并重新训练所述重新训练的异常检测模型(f

i)。2.根据权利要求1中任一项所述的方法,还包括:在所述子集和所述新子集中填充包含所述异常数据点的异常数据集。3.根据权利要求2所述的方法,还包括:用所述异常数据集更新所述训练数据集。4.根据权利要求1所述的方法,还包括:接收至少包括所述正常数据点的所述训练数据集(L),其中基于工程软件输入和类似工业环境的操作中的至少一者来分类所述正常数据点;以及基于包括所述正常数据点的所述训练数据集(L)来训练所述异常检测模型(fi)。5.根据权利要求1所述的方法,还包括:基于工程软件输入和类似工业环境的操作中的至少一者来确定所述子集

数据点的分类中的置信指数;当不满足置信阈值时,对所述子集

数据点进行重新分类;以及用所述置信指数和所重新分类的数据点来更新所述训练数据集。6.根据前述权利要求中任一项所述的方法,其中,所述一个或多个异常检测模型(fi)被包含在异常检测流水线(224,306,326)中,其中所述异常检测流水线(224,306,326)被实现为训练、分类和重新训练的迭代工作流...

【专利技术属性】
技术研发人员:冯竞弗拉迪米尔
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1