一种异常检测模型训练方法、异常检测方法及装置制造方法及图纸

技术编号：35910493 阅读：11 留言：0更新日期：2022-12-10 10:50

本发明专利技术提供了一种异常检测模型训练方法、异常检测方法及装置，其中，异常检测模型训练方法包括：获取初始训练集；将初始训练集中的样本分别输入不同的异常分类模型进行预测，并根据预测类别进行标签标记；基于各样本对应的预测类别和标签分别计算各样本的投票熵；对投票熵大于熵值阈值的样本进行目标标记；利用带有目标标记的样本对目标异常分类模型进行训练，得到训练好的目标异常分类模型。在最大化提高异常检测模型准确率的同时，大幅降低由于过度依赖特征工程或对异常模式的挖掘单一导致异常检测假阳性概率过高的情况发生。致异常检测假阳性概率过高的情况发生。致异常检测假阳性概率过高的情况发生。

全部详细技术资料下载

【技术实现步骤摘要】
一种异常检测模型训练方法、异常检测方法及装置

[0001]本专利技术涉及异常检测领域，具体涉及一种异常检测模型训练方法、异常检测方法及装置。

技术介绍

[0002]现有的异常检测方式大多是采用无监督的方法，例如基于密度、距离以及基于聚类等的方式进行异常检测，传统的无监督异常检测方法在原始的数据上进行特征工程的计算得到异常分数排序列表，利用异常分数排序列表进行异常检测，因此，特征工程的好坏极大程度地影响了异常检测的准确度，由于缺乏领域知识，其对异常模式的挖掘单一，异常检测结果可能存在噪声或用户不感兴趣的异常模式，导致假阳性(即真实结果为假，但是算法的预测结果为真)的概率增加。
[0003]若采用有监督的异常检测方式，虽然可以通过预先的训练集去训练一个异常检测准确率较高的模型，但由于异常结果属于少数，往往不能获得足够的带有标签的训练数据提供给模型来进行学习。

技术实现思路

[0004]因此，本专利技术要解决的技术问题在于克服现有技术中的有监督异常检测模型由于训练集样本过少导致无法保证其学习效果，且无监督异常检测方式存在假阳性概率过高的缺陷，从而提供一种异常检测模型训练方法、异常检测方法及装置。
[0005]根据第一方面，本专利技术实施例提供了一种异常检测模型训练方法，所述方法包括：
[0006]获取初始训练集，所述初始训练集内包含若干样本；
[0007]将所述初始训练集中的样本分别输入不同的异常分类模型进行预测，并根据预测类别进行标签标记；
[0008]基于各样本对...

【技术保护点】

【技术特征摘要】
1.一种异常检测模型训练方法，其特征在于，包括：获取初始训练集，所述初始训练集内包含若干样本；将所述初始训练集中的样本分别输入不同的异常分类模型进行预测，并根据预测类别进行标签标记；基于各样本对应的所述预测类别和所述标签分别计算各样本的投票熵；对投票熵大于熵值阈值的样本进行目标标记；利用带有目标标记的样本对目标异常分类模型进行训练，得到训练好的目标异常分类模型。2.根据权利要求1所述的方法，其特征在于，所述对投票熵大于熵值阈值的样本进行目标标记，包括：获取投票熵大于熵值阈值的当前样本的属性，所述属性数量为若干；对所述当前样本的属性进行权重计算，得到各属性的特征值；将各所述属性的特征值进行降序排序，确定所述当前样本的异常属性顺序；基于所述异常属性顺序对所述当前样本进行目标标记。3.根据权利要求2所述的方法，其特征在于，所述基于所述异常属性顺序对所述当前样本进行目标标记，包括：基于所述异常属性顺序选取目标数量的属性；基于所述当前样本处于所述目标数量内的属性，对所述当前样本进行目标标记。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述利用带有目标标记的样本对目标异常分类模型进行训练，得到训练好的目标异常分类模型，包括：将带有目标标记的样本输入目标异常分类模型进行模型训练；基于模型训练结果计算所述目标异常分类模型的置信度；当所有带有目标标记的样本对应的置信度达到置信度阈值时，得到训练好的目标异常分类模型；当存在带有目标标记的样本对应的置信度未达到置信度阈值时，重新获取新的初始训练集并返回所述将所述初始训练集中的样本分别输入不同的异常分类模型进行预测的步骤，直至所有带有目标标记的样本对应的置信度达到置信度阈值或者获取初始训练集的次数达到目标次数时，得到训练好的目标异常分类模型。5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员：刘卫卫，雷舒娅，彭梁英，冯珺，
申请(专利权)人：国网浙江省电力有限公司信息通信分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人