一种基于约束规则和相似度的工控异常检测数据集均衡方法技术

技术编号:41143643 阅读:21 留言:0更新日期:2024-04-30 18:12
本申请涉及工业控制系统安全领域,公开了一种基于约束规则和相似度的工控异常检测数据集均衡方法,包括以下步骤:采集工业控制系统传感器和执行器数据,形成工业控制系统异常检测训练数据集,使用不平衡数据集训练孪生网络,训练好的孪生网络,根据工控控制系统特性制定数据约束规则,根据约束规则产生随机数据样本,将随机数据样本输入训练好的孪生网络,得到样本的哈希向量,计算其与所有异常样本的汉明距离,如果最小距离小于阈值,则保存该随机样本到数据集,重复随机样本生成和样本筛选步骤,直到总异常样本的数量与数据集中的正常样本数量相同。本发明专利技术有生成均衡数据集速度快,生成的异常样本符合真实异常样本数据分布,样本质量高的特点。

【技术实现步骤摘要】

本申请涉及工业控制系统安全领域,更具体地,涉及一种基于约束规则和相似度的工控异常检测数据集均衡方法


技术介绍

1、工业控制系统异常检测是确保工业过程稳定运行的重要组成部分。异常检测系统通过监测传感器、执行器数据或其他相关信息来识别可能表明设备或过程出现问题的异常情况。训练数据集的均衡对于异常检测模型的性能至关重要,使用不平衡的数据集训练模型可能导致模型对于少数类别的异常样本学习不足。

2、目前用于工业控制系统异常检测训练数据集均衡的方法包括采样方法(如欠采样和过采样)、生成合成样本(如smote)、权重调整、交叉验证策略和特征工程。然而,这些方法存在一些不足。欠采样可能导致信息丢失,削减了正常样本的数量,影响模型对正常情况的全面理解。生成合成样本的质量成为关键问题,低质量的合成样本可能降低模型的泛化能力。过采样和生成合成样本也带来了过拟合风险,特别是在异常样本多样性较大的情况下。方法的算法复杂性增加了系统的维护难度,而一些方法对特征的依赖性高,可能导致在变化的实际场景中性能下降。

3、cn116521312a公开了一种基于深度学习本文档来自技高网...

【技术保护点】

1.一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于包含有以下步骤:

2.根据权利要求1所述的一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于,包括以下具体步骤:

3.根据权利要求2所述的一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于,T的值为3秒。

4.根据权利要求2所述的一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于,入的值为10-3。

5.根据权利要求2所述的一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于,η的值为0.001。

【技术特征摘要】

1.一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于包含有以下步骤:

2.根据权利要求1所述的一种基于约束规则和相似度的工控异常检测数据集均衡方法,其特征在于,包括以下具体步骤:

3.根据权利要求2所述的一种基于约束规则和相似度的工控异常检测数据...

【专利技术属性】
技术研发人员:汪俊洋吴青张敏周康毕坤魏博文陈嵩陈明德杜翔魏可仪谢惠君程国昌
申请(专利权)人:国网湖北省电力有限公司鄂州供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1