训练机器学习模型以进行数据驱动的决策制造技术

技术编号:33907040 阅读:18 留言:0更新日期:2022-06-25 18:50
用于训练机器学习模型(51)的方法包括:通过一个或多个计算机(52)采集(S10)借助一个或多个测量装置(60

【技术实现步骤摘要】
【国外来华专利技术】训练机器学习模型以进行数据驱动的决策


[0001]本公开尤其涉及用于训练机器学习模型的方法和系统、计算机程序产品以及机器学习模型。

技术介绍

[0002]目前,为了进行决策,例如为了确定有故障的和要更换的部件,或者在对指标(Kennzahlen)进行定期评估的情况下,人们经常对确定的数据进行分类。然而,这种决策经常需要许多时间,并且在一些应用情况下在短反应时间之内的数据驱动的决策是必要的。此外,可以为要监控的系统开发专门的分析工具,然而这通常是非常耗费的,并且在被监控的系统改变的情况下,通常必须烦琐地进行适配。可能的是,例如通过提供多个分别具有自行车的照片和说明“自行车”以及没有自行车的其他照片和说明“没有自行车”,利用数据和这些数据的分类来训练人工智能KI。然而,这种KI的学习过程典型地是漫长的,因为例如在许多情况下使用几千个数据集,而且KI常常容易出错,这限制可能的应用范围。

技术实现思路

[0003]本专利技术的任务是实现一种改进的、自动化的、数据驱动的决策。
[0004]根据一个方面,提供一种用于训练机器学习模型以用于基于数据的决策的方法。该方法包括采集数据,即采集测量数据。所述数据、即测量数据通过一个或多个计算机来采集,并(要么在该方法的范围内要么事先)借助一个测量装置或多个测量装置获得。测量装置(分别)以用于测量物理变量的传感器的形式构成。这些数据包括例如多个通过一个或多个测量装置采集的值和/或关于维护过程或状态的说明。数据以时间序列数据的形式采集。一个或多个计算机获得与数据、尤其测量数据有关的多个分类数据单元。所述分类数据单元中的每个分类数据单元包括数据的分类。该分类涉及所采集的数据。此外,该方法包括通过一个或多个计算机针对每个分类数据单元接收数据的选定部分。该选定部分最多包括与所采集的数据完全一样多的值。此外,该方法包括借助一个或多个计算机分别基于所述分类数据单元中的至少一个分类数据单元和所述数据的至少一个相应的选定部分(以及可选地,附加地根据完整的数据)训练多个机器学习模型,所述机器学习模型是一个机器学习模型的同一类型的多个实例。在此,不同的机器学习模型(同一机器学习模型的实例)尤其利用不同的分类数据单元和选定部分来训练。
[0005]这基于如下认识:在构成决策的基础的数据的情况下,确定的时间段中的测量值允许特别精确地推断出测量装置或通过测量装置所监控的部件的状态,其中多个例如通过不同用户执行的关于相同数据的不同的选定和分类可以导致不同的、但是分别潜在地有说服力的结果。尤其在例如涉及燃气涡轮发动机或活塞式引擎的测量装置时,数据中的确定的签名可以是该测量装置或利用该测量装置被监控或可监控的构件的恶化状态的标志。通过基于数据的相应的选定部分的选择连同相应的分类数据单元进行机器学习模型的训练,借助这样被训练的机器学习模型的决策的明显改进的质量是可能的,以及不同的分类的比
较是可能的。被训练的机器学习模型此外允许广泛的自动化。此外,用于训练机器学习模型所需的数据量可以被减少。这尤其在如下这种应用的情况下可以是有利的,在所述应用中总体上仅有限的数据量可用于训练,所述数据量在通常被训练的机器学习模型的情况下并不是足够的。此外,可能的是,使该方法适配于各种不同的应用情况,例如其方式是:仅采集与相应的决策相关联的数据以及分类数据单元和选定部分。超出训练的、机器学习模型与不同的应用情况的适配不是必需的。
[0006]例如,分类包括两个或三个决策可能性。例如,在分类的情况下从两个答案(例如A或B)中或从三个答案(例如A、B或C)中选择。例如,分类对应于是/否决策或在可能性A(例如是)、B(例如否)和C(例如“未知”或“未定义”)之间的决策的结果。分类数据单元例如分别包括说明“是”或“否”,或阳性或阴性、例如1或0的另一说明。这些数据例如包括在不同时刻的多个离散值。可选地,该方法的一些或所有步骤多次、例如迭代地被执行。数据的选定部分可以被评估,以便获得指标(例如最小值和/或最大值和/或标准偏差)。可选地,根据一个或多个这样的指标执行机器学习模型的训练。数据的选定部分可选地利用用户的元数据(例如用于选定所需的时间)和/或利用附加的由用户输入的信息(例如所采集的数据中的确定的特征的分类和识别)来充实。数据的选定部分构成数据集。
[0007]机器学习模型例如可以分别作为数字助理被用于借助人工智能进行数据驱动的决策。
[0008]该(或多个)测量装置(分别)以传感器的形式构成用于测量物理变量,例如用于测量温度、速度、转速或压力。例如,一个或多个计算机从一个测量装置或多个测量装置获得多个时间上相继的测量值。数据的每个选定部分例如对应于一个时间窗口或多个时间窗口,所述时间窗口比由所采集的数据总体上所跨越的时间段小(最多正好一样大)。可选地,从多个测量装置的(尤其分别呈时间序列数据形式的)数据产生多维(例如二维)数据,其中数据的选定部分分别例如从多维数据中选择。
[0009]为了训练机器学习模型,例如以一个或多个参数(例如最大值、最小值、中值、平均值、方差等)的形式提取数据的相应的选定部分的特性,其中基于所述参数执行训练。所述参数中的至少一个参数可以是统计参数。
[0010]所述机器学习模型中的每个机器学习模型实现人工智能,并且尤其可以以助理的形式被用于支持用户、例如人类专家。每个机器学习模型可以是或包括分类模型。尤其,所述机器学习模型中的每个机器学习模型可以是或包括人工神经网络。此外,所述机器学习模型中的每个机器学习模型可以包括监督学习模型、决策树模型、随机森林模型、支持向量机、k最近邻模型和/或XGBoost模型等。可选地,借助回归模型来处理具有连续变量的数据。
[0011]该方法可选地此外包括借助一个或多个计算机在至少一个界面上尤其多次提供数据,尤其用于为多个用户显示。在此可以规定,通过一个或多个计算机接收的分类数据单元涉及多次在至少一个界面上提供的数据。经由该界面(或多个界面中的每个界面)可以进行数据的分类,并且可以使用户实现数据的选定部分的选择。这例如可以通过提供附加的、专门被设置用于训练相应的机器学习模型的测量装置进行和/或通过由人类用户进行的分类来进行。
[0012]多个测量装置的数据可以同时在界面上提供。由此可以进一步改进训练的质量。
[0013]可选地,数据显示一个或多个机器、尤其一个或多个引擎、例如活塞式引擎(尤其
柴油引擎)、例如一个燃气涡轮机或多个燃气涡轮机的测量值。恰好在燃气涡轮机的情况下经常期望:尽可能早地识别出测量装置或通过测量装置所监控的部件的恶化状态,这由这样被训练的机器学习模型实现。
[0014]机器学习模型可以分别在每次提供相应的分类数据单元之后被训练。这实现不断优化的训练状态。替代地,例如一旦已提供了预定数量的分类数据单元,机器学习模型于是就利用与不同的数据有关的分类数据单元和数据的相关的选定部分来训练。这例如利用有限的计算能力实现有效训练。
[0015]在采集借助一个或多个测量装置所获得的数据的情况下,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练机器学习模型(51,57)的方法,该方法包括:
‑ꢀ
通过一个或多个计算机(52)采集(S10)借助一个或多个测量装置(60

62)所获得的、时间序列数据形式的数据(70),所述测量装置分别呈用于测量物理变量的传感器的形式;
‑ꢀ
通过所述一个或多个计算机(52)接收(S12)与所述数据(70)有关的多个分类数据单元;
‑ꢀ
通过所述一个或多个计算机(52)并且针对每个分类数据单元接收(S13)所述数据(70)的选定部分(71);和
‑ꢀ
通过所述一个或多个计算机(52)分别基于所述分类数据单元中的至少一个分类数据单元和所述数据(70)的相应的至少一个选定部分(71)训练(S14)多个机器学习模型(51),其中所述多个机器学习模型(51)是同一机器学习模型的多个实例。2.根据权利要求1所述的方法,其中所述数据(70)的每个选定部分(71)的特性以参数的形式被提取,并且分别基于所述参数执行所述多个机器学习模型(51)的训练(S14)。3.根据权利要求1或2所述的方法,此外包括:
‑ꢀ
借助所述一个或多个计算机(52)在至少一个界面(81)上多次提供(S11)所述数据(70),用于为多个用户显示。4.根据上述权利要求中任一项所述的方法,其中所述数据(70)显示一个或多个机器、尤其一个或多个燃气涡轮机(10)的测量值。5.根据上述权利要求中任一项所述的方法,其中针对所述机器学习模型(51)中的每个机器学习模型确定预测精度。6.根据权利要求5所述的方法,其中所述预测精度被显示在界面(84)上。7.根据权利要求6所述的方法, 其中经由所述界面(84),所述机器学习模型中的一个或多个机器学习模型是可选择的并且被选择。8.根据上述权利要求中任一项所述的方法,其中从所述多个机器学习模型(51)的参数计算出上级的机器学习模型(57)。9.根据权利要求8所述的方法,其中各个机器学习模型(51)利用不同的加权因子来加权,用于计算出所述上级的机器学习模型(57)。10.根据就引用权利要求5而言的权利要求9所述的方法,其中所述加权因子基于所述预测精度来确定。11.一种用于对数据(70)进行分类的方法,该方法包括:
‑ꢀ
提供(S1)根据权利要求8至10中任一项所述的方法所计算出的上级的机器学习模型(57);
‑ꢀ

【专利技术属性】
技术研发人员:S
申请(专利权)人:劳斯莱斯德国有限两合公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1