用于检测异常的方法和设备、相应的计算机程序产品和非暂时性计算机可读载体介质技术

技术编号:33339608 阅读:29 留言:0更新日期:2022-05-08 09:24
一种用于检测异常的方法,所述方法由机器学习系统(130)执行,所述机器学习系统被配置为从训练数据集学习至少一个模型(132),所述方法包括:接收来自数量为N的多个传感器(100)的传感器数据;基于所述传感器数据和所述至少一个模型,计算异常预测;以及如果所述异常预测是异常检测,则发送包括所述异常预测的异常事件(11)。所述方法还包括接收与所述异常事件或异常事件缺失相关的用户反馈(12),以及基于所述用户反馈调整所述至少一个模型。所述用户反馈调整所述至少一个模型。所述用户反馈调整所述至少一个模型。

【技术实现步骤摘要】
【国外来华专利技术】用于检测异常的方法和设备、相应的计算机程序产品和非暂时性计算机可读载体介质


[0001]本公开的领域是机器学习(ML)和异常检测领域。
[0002]更特别地,本公开涉及由机器学习系统执行的异常检测方法。
[0003]执行机器学习涉及创建模型,该模型基于一些训练数据被训练,然后该模型可以处理附加的数据以进行预测。针对机器学习系统,已知各种类型的模型(例如,人工神经网络、判定树、支持向量机、贝叶斯网络、遗传算法等)。
[0004]在机器学习(ML)的领域内,存在两种主要类型的方法:有监督的和无监督的。这两种类型之间的主要区别在于,有监督学习是在具有针对样本的输出值应该是何值的先验知识的情况下进行的。因此,有监督学习的目标是学习以下函数:在给定数据的样本和期望的输出的情况下,该函数最佳逼近在该数据中可观察到的输入与输出之间的关系。另一方面,无监督学习不具有标记的输出,因此它的目标是推断数据点集内呈现的自然结构。换言之,有监督学习算法使用包括输入和期望的输出二者的数据集,而无监督学习算法采用仅包括输入的数据集。
[0005]常规地,异常检测方法包括:接收来自数量为N的多个传感器的传感器数据;基于传感器数据和至少一个模型,计算异常预测;以及如果该异常预测是异常检测,则发送包括该异常预测的异常事件。
[0006]本公开可以尤其但不排他地应用于依赖于随时间对源自家庭传感器的多个数据的收集来检测家庭异常。在这种特定情况下,为了在学习阶段期间尽可能无缝对接终端用户,通常考虑无监督ML方法,该无监督ML方法允许系统学习并自适应终端用户的家庭习惯和环境改变。目标是建立在家庭处于正常情况下的模型,并随时间向终端用户通知可能发生的家庭异常。为此,多个传感器被部署于家庭,并根据ML构建模型所需的模态被定义。

技术介绍

[0007]在使用异常检测方法时经常出现的问题是如何贴切地更新模型,特别是在无监督ML中(以及在有监督ML中)。实际上,为使模型准确预测,模型进行预测所基于的数据必须具有与模型进行训练所基于的数据相似的分布。由于能够预期到数据分布会随时间而漂移,因此部署模型不是一次性的动作,而是持续的过程。
[0008]常规地,更新模型是通过利用补充的新训练数据集重新训练模型来执行的。换言之,以下是已知的实践操作:如果数据分布已经明显偏离了原始训练数据分布,则持续监视输入的数据并基于新训练数据重新训练模型。如果监视数据以检测数据分布的改变的开销很大,则替代的更简单的策略是周期性重新训练模型,例如,每天、每周或每月。这就是许多模型默认地经常被重新训练的原因。
[0009]然而,用于更新模型的包括重新训练模型的上述已知方案,具有一些缺点。
[0010]第一个缺点是,在周期性重新训练模型时,可能会出现无效的多余的重新训练,这会产生成本(计算、评估、实现复杂性等方面)。
[0011]第二个缺点是,利用新训练数据重新训练模型并不总是最优的,因为新训练数据并不总是最适应用户和/或用户的家庭。换言之,已知的方案并不总是向着各个用户的个性化的异常情况和/或家庭习惯方向被调整。
[0012]第三个缺点是,在模型的学习阶段之后的生产阶段(使用模型)期间,在对当前的多个传感器添加或移除传感器时,重新训练模型不会有功能上的扩展。

技术实现思路

[0013]本公开的一个特定方面涉及用于检测异常的方法,所述方法由机器学习系统执行,所述机器学习系统被配置为从训练数据集学习至少一个模型,所述方法包括:
[0014]接收来自数量为N的多个传感器的传感器数据;
[0015]基于所述传感器数据和所述至少一个模型,计算异常预测;以及
[0016]如果所述异常预测是异常检测,则发送包括所述异常预测的异常事件;
[0017]所述方法还包括:
[0018]接收属于包括以下项的组的用户反馈:
[0019]指示包括在所述异常事件中的所述异常预测正确的用户反馈;
[0020]指示包括在所述异常事件中的所述异常预测不正确的用户反馈;
[0021]指示与不正确异常预测对应的异常事件缺失的用户反馈;以及
[0022]基于所述用户反馈调整所述至少一个模型。
[0023]所提出的方案的总体原则是基于用户反馈调整(一个或多个)模型。我们假设(一个或多个)模型已经预先在学习阶段期间学习过(例如,无监督学习类型,或者以变形形式、有监督学习类型)。
[0024]用户反馈仅需要用户的轻微介入(例如,仅需要二进制形式的回答),并且例如在以下情况中的至少一种情况下发生:
[0025]“假阳性”:用于指示包括在异常事件中的异常预测不正确(即,当异常被虚假地检测到时,意味着模型将事件检测为异常但该事件不是异常);
[0026]“真阳性”:用于指示包括在异常事件中的异常预测正确(即,当异常被真实地检测到时,意味着模型将事件检测为异常并且该事件是异常);或者
[0027]“假阴性”:指示与不正确无异常预测对应的异常事件缺失(即,当应被检测为警报的事件发生时,该事件未被检测为警报)。
[0028]提出的方案(基于用户反馈调整(一个或多个)模型)具有以下一些优点:
[0029](一个或多个)模型将更好地进行执行(没有(或更少)“假阳性”或“假阴性”);
[0030](一个或多个)模型的调整可以单独实现、或者可以与使用补充训练数据集重新训练(一个或多个)模型结合来实现,因此可以减少或避免无效的多余的重新训练(和相应的成本);
[0031](一个或多个)模型适应用户和/或其家庭,因此向着各个用户的个性化的异常情况和/或家庭习惯方向被调整。
[0032]根据第一实施例,所述机器学习系统包括:
[0033]至少两个单模态异常模型,每个单模态异常模型与所述数量为N的多个传感器中的一个不同的传感器相关联,并且每个单模态异常模型被配置为基于来自相关联的传感器
的传感器数据,计算单模态异常预测;以及
[0034]判定器,被配置为通过将至少一个判定规则应用于所述单模态异常预测,来计算所述异常预测;
[0035]并且基于所述用户反馈调整所述至少一个模型包括以下项中的至少一个:
[0036]调整所述单模态异常模型中的至少一个;以及
[0037]调整所述至少一个判定规则。
[0038]根据第一实施例的一个特定特征,在所述至少一个判定规则中,每个单模态异常预测被加权相关联的权重因子,并且其中,调整所述至少一个判定规则包括以下项中的至少一个:
[0039]调整所述权重因子中的至少一个;以及
[0040]调整阈值,所述阈值用于与已被加权了各自的加权因子的所述单模态异常预测的组合进行比较。
[0041]根据第一实施例的一个特定特征,调整所述权重因子中的至少一个包括:如果所述用户反馈指示包括在所述异常事件中的所述异常预测正确,则增大导致正确异常预测的各个单模态异常预测的权重因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于检测异常的方法,所述方法由机器学习系统(130、130

)执行,所述机器学习系统被配置为从训练数据集学习至少一个模型(132、132

),所述方法包括:接收(21)来自数量为N的多个传感器(100)的传感器数据;基于所述传感器数据和所述至少一个模型,计算(22)异常预测;以及如果所述异常预测是异常检测,则发送包括所述异常预测的异常事件(11);其特征在于,所述方法还包括:接收(25)属于包括以下项的组的用户反馈(12):指示包括在所述异常事件中的所述异常预测正确的用户反馈;指示包括在所述异常事件中的所述异常预测不正确的用户反馈;指示与不正确异常预测对应的异常事件缺失的用户反馈;以及基于所述用户反馈调整(27)所述至少一个模型。2.根据权利要求1所述的方法,其中,所述机器学习系统(130)包括:至少两个单模态异常模型(132),每个单模态异常模型与所述数量为N的多个传感器中的一个不同的传感器相关联,并且每个单模态异常模型被配置为基于来自相关联的传感器的传感器数据,计算单模态异常预测;以及判定器(133),被配置为通过将至少一个判定规则应用于所述单模态异常预测,来计算所述异常预测;并且其中,基于所述用户反馈调整(27)所述至少一个模型包括以下项中的至少一个:调整所述单模态异常模型中的至少一个;以及调整所述至少一个判定规则。3.根据权利要求2所述的方法,其中,在所述至少一个判定规则中,每个单模态异常预测被加权相关联的权重因子,并且其中,调整(27)所述至少一个判定规则包括以下项中的至少一个:调整所述权重因子中的至少一个;以及调整阈值,所述阈值用于与已被加权了各自的加权因子的所述单模态异常预测的组合进行比较。4.根据权利要求3所述的方法,其中,所述调整(27)所述权重因子中的至少一个包括:如果所述用户反馈指示包括在所述异常事件中的所述异常预测正确,则增大导致正确异常预测的各个单模态异常预测的权重因子,并减小未导致正确异常预测的各个单模态异常预测的权重因子。5.根据权利要求3至4中任一项所述的方法,其中,所述调整(27)所述权重因子中的至少一个包括:如果所述用户反馈指示包括在所述异常事件中的所述异常预测不正确,则增大未导致不正确异常预测的各个单模态异常预测的权重因子,并减小导致不正确异常预测的各个单模态异常预测的权重因子。6.根据权利要求3至5中任一项所述的方法,其中,所述调整(27)所述权重因子中的至少一个包括:如果所述用户反馈指示与不正确异常预测对应的异常事件缺失,则增大未导致不正确异常预测的各个单模态异常预测的权重因子,并减小导致不正确异常预测的各个单模态异
常预测的权重因子。7.根据权利要求1至6中任一项所述的方法,其中,当新传感器被添加到所述数量为N的多个传感器时,所述方法还包括:添加(31)新单模态异常模型,以用于分析来自所述新传感器的传感器数据;以及将所述新单模态异常模型的权重因子初始化(32)为1...

【专利技术属性】
技术研发人员:菲利普
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1