用于时间序列数据的基于簇的分类制造技术

技术编号:30426410 阅读:15 留言:0更新日期:2021-10-24 17:10
为了分析在机器上监控的时间序列数据,设备(200)将时间序列数据分割成多个时间段(230)。此外,设备(200)确定估计具有相同的时间序列数据动态的时间段的簇。设备(200)然后基于与时间段中的至少一个相关联的标签信息对簇进行分类。如果簇的时间段都没有关联的标签信息,则设备(200)向用户(10)呈现簇的时间序列数据的至少一部分。基于响应于呈现时间序列数据而接收到的用户输入,设备(200)对簇进行分类并生成与簇的时间段相关联的标签信息。所生成的标签信息指示对簇分类的结果。所生成的标签信息指示对簇分类的结果。所生成的标签信息指示对簇分类的结果。

【技术实现步骤摘要】
【国外来华专利技术】用于时间序列数据的基于簇的分类


[0001]本公开涉及用于分析时间序列数据的设备和方法。

技术介绍

[0002]在各个
,需要监控机器或机器系统的操作。例如,在石油或天然气生产领域,为了提供预防性维护并从而确保高可用性,可以监控大量泵,通常是电潜泵(ESP)。
[0003]为了有效地监控大量机器,需要利用至少部分基于人工智能(AI)的监控机制。这种基于AI的机制可以分析通过监控多台机器获取的时间序列数据,自动识别异常行为,并触发措施以解决导致异常行为的问题,例如,通过向操作员发出警告。当监控泵时,基于AI的机制可以例如自动将检测到的异常分类为例如堵塞、泄漏、轴损坏等。
[0004]AI机制可以基于预定义的规则,例如,由领域专家制定,和/或基于机器学习。然而,制定和维护适当的规则通常是一项复杂的任务。另一方面,机器学习方法通常对应于黑盒方法。也就是说,机器学习过程所训练的AI机制的输出可能难以理解并且通常不会对其决策或分类的原因提供进一步的解释。此外,机器学习过程通常需要相当大量的人工准备的训练数据,而准备这样的训练数据可能是一个繁琐的过程。更进一步,当利用机器学习时,只有在机器学习过程至少在一定程度上完成后才能应用AI机制,因此通常不可能立即解决新的行为类型。
[0005]WO 2017/034512 A1描述了时间序列数据的交互式分析,涉及基于机器学习和用户交互的时间序列数据的自动分割和聚类。
[0006]WO 2018/140337 A1描述了一种用于机器状态监控和故障诊断的半监督方法,涉及将时间序列数据划分为段簇并将段簇聚类为簇原型,该簇原型用于学习预测类别标签的判别模型。用户可以在创建段簇后手动为其提供标签。
[0007]US 2007/279490 Al使用两级训练过程,挖掘监视视频以检测异常事件。在第一级,对视频流的部段进行无监督聚类,将一组异常事件与用户反馈相结合以生成干净的训练集。在第二组中,使用干净的训练集来训练更精确的模型。
[0008]因此,需要允许有效且准确地对由监控机器获取的时间序列数据进行分类的技术。

技术实现思路

[0009]鉴于上述需要,本公开提供如权利要求1所限定的设备和如权利要求10所限定的方法。从属权利要求定义了进一步的实施例。
[0010]根据一个实施例,提供了一种用于分析时间序列数据的设备。该设备被配置为:
[0011]‑
获取在机器(例如泵、磨机、电动机、内燃机和/或涡轮机)上监控的时间序列数据;
[0012]‑
将时间序列数据分割为多个时间段;
[0013]‑
确定估计具有相同的时间序列数据动态的时间段的簇;
[0014]‑
检查与时间段的至少一个相关联的标签信息是否可用;
[0015]‑
如果与时间段的至少一个相关联的标签信息可用,则基于与时间段的至少一个相关联的标签信息对簇进行分类;
[0016]‑
如果簇的时间段都没有关联的标签信息,则将簇的时间序列数据的至少一部分呈现给用户;以及
[0017]‑
基于响应于呈现时间序列数据的至少一部分而接收到的用户输入,对簇进行分类并生成与簇的时间段相关联的标签信息,所生成的标签信息指示对簇进行分类的结果。
[0018]通过这种方式,该设备可以通过利用现有的标签信息对显示类似动态的其他时间序列数据实现时间序列数据的有效分类,同时可以通过调用用户输入以对时间序列进行分类并生成新的标签信息来处理新的行为类型。因此用户例如领域专家或机器学习专家,可以以直观和有效的方式管理新标签信息的生成,并且能够在常规监控操作期间有效地学习在时间序列数据中识别的新行为类型。
[0019]根据一个实施例,该设备被配置为基于时间序列数据动态的概率模型确定时间序列数据的和簇的时间段。通过这种方式,可以以精确且可再现的方式评估不同时间的时间序列数据的相似性。
[0020]根据一个实施例,该设备进一步被配置为:
[0021]‑
如果簇的两个或更多个时间段具有冲突的关联标签信息,则将簇的时间序列数据的至少一部分呈现给用户。
[0022]因此,可以以有效且直观的方式解决冲突的分类。
[0023]根据一个实施例,该设备进一步被配置为:
[0024]‑
如果簇的两个或更多个时间段具有冲突的关联标签信息,则选择标签信息的非冲突部分,并基于所选的标签信息的非冲突部分对簇进行分类。该设备可以被配置为基于与标签信息相关联的时间段的累积时间长度来选择标签信息的非冲突部分。可替代地或另外地,该设备可以被配置为基于时间序列数据动态的概率模型来选择标签信息的非冲突部分。
[0025]通过这种方式,可以自动解决标签信息的冲突,或者设备可以高效地帮助用户解决标签信息的冲突。
[0026]根据一个实施例,该设备被配置为通过将簇分配到多个类别中的一个类别来对簇进行分类,这些类别包括:机器的正常运行、机器的异常运行、未知的动态和冲突的标签信息。然而,应注意,也可以使用其他类别,例如不同类型的异常运行或不同类型的常规运行。这些类别可以在常规监控操作期间实现对机器的有效监控和对时间序列数据中所识别的学习新行为类型的有效管理。
[0027]根据进一步的实施例,提供了一种分析时间序列数据的方法。该方法包括:
[0028]‑
获取在机器(例如泵、磨机、电动机、内燃机和/或涡轮机)上监控的时间序列数据;
[0029]‑
将时间序列数据分割为多个时间段;
[0030]‑
确定估计具有相同的时间序列数据动态的时间段的簇;
[0031]‑
检查与时间段的至少一个相关联的标签信息是否可用;
[0032]‑
如果与时间段的至少一个相关联的标签信息可用,则基于与时间段的至少一个
相关联的标签信息对簇进行分类;
[0033]‑
如果簇的时间段都没有关联的标签信息,则将簇的时间序列数据的至少一部分呈现给用户;以及
[0034]‑
基于响应于呈现时间序列数据的至少一部分而接收到的用户输入,对簇进行分类并生成与簇的时间段相关联的标签信息,所生成的标签信息指示对簇进行分类的结果。
[0035]通过这种方式,该方法可以通过利用现有的标签信息对显示类似动态的其他时间序列数据实现时间序列数据的有效分类,同时可以通过调用用户输入以对时间序列进行分类并生成新的标签信息来处理新的行为类型。因此用户例如领域专家或机器学习专家,可以以直观和有效的方式管理新标签信息的生成,并且能够在常规监控操作期间有效地学习在时间序列数据中识别的新行为类型。
[0036]根据一个实施例,该方法进一步包括:
[0037]‑
基于时间序列数据动态的概率模型确定时间序列数据的时间段和簇。
[0038]通过这种方式,该方法可以使得能够以精确且可再现的方式评估不同时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于分析时间序列数据的设备(200,400),所述设备(200,400)被配置为:

获取在机器上监控的时间序列数据(100);

将所述时间序列数据分割成多个时间段(230);

确定估计具有相同的时间序列数据动态的时间段的簇(11,12);

检查与所述时间段(230)的至少一个相关联的标签信息是否可用;

如果与所述时间段(230)的至少一个相关联的标签信息可用,则基于与所述时间段(230)的至少一个相关联的所述标签信息对所述簇(11,12)进行分类;

如果所述簇(11,12)的所述时间段都没有关联的标签信息,则将所述簇的所述时间序列数据的至少一部分呈现给用户(10);以及

基于响应于呈现所述时间序列数据的至少一部分而接收到的用户输入,对所述簇(11,12)进行分类并生成与所述簇(11,12)的所述时间段相关联的标签信息,所生成的标签信息指示对所述簇(11,12)进行分类的结果。2.根据权利要求1所述的设备(200,400),其中,所述设备(200,400)被配置为基于所述时间序列数据动态的概率模型,确定所述时间序列数据的和所述簇(11,12)的所述时间段(230)。3.根据权利要求1或2所述的设备(200,400),其中,所述设备(200,400)进一步被配置为:

如果所述簇的两个或更多个所述时间段具有冲突的关联标签信息,则将所述簇的所述时间序列数据的至少一部分呈现给所述用户(10)。4.根据前述权利要求中的任一项所述的设备(200,400),其中,所述设备(200,400)进一步被配置为:

如果所述簇(11,12)的两个或更多个所述时间段具有冲突的关联标签信息,则选择所述标签信息的非冲突部分,并基于所选的所述标签信息的所述非冲突部分对所述簇(11,12)进行分类。5.根据权利要求4所述的设备(200,400),其中,所述设备(200,400)被配置为基于与所述标签信息相关联的所述时间段的累积时间长度来选择所述标签信息的所述非冲突部分。6.根据权利要求4或5所述的设备(200,400),其中,所述设备(200,400)被配置为基于所述时间序列数据动态的概率模型来选择所述标签信息的所述非冲突部分。7.根据前述权利要求中的任一项所述的设备(200,400),其中,所述设备(200,400)被配置为通过将所述簇分配到多个类别中的一个类别来对所述簇(11,12)进行分类,所述多个类别包括:所述机器(100)的正常运行、所述机器(100)的异常运行、未知动态以及冲突的标签信息。8.根据前述权利要求中的任一项所述的设备(200,400),其中,所述机器(100)...

【专利技术属性】
技术研发人员:马库斯
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1