当前位置: 首页 > 专利查询>中南大学专利>正文

基于社区特征选择的ICPS无监督在线攻击检测方法和设备技术

技术编号:33551992 阅读:38 留言:0更新日期:2022-05-26 22:48
本发明专利技术公开了一种基于社区特征选择的ICPS无监督在线攻击检测方法和设备,方法为:根据ICPS的历史多源特征数集构建特征网络,并基于社区检测方法自动划分得到多个特征子集,从中选择最佳特征子集进而获取训练数据;构建基于自编码器的攻击检测模型,使用训练数据进行训练;然后使用训练好的攻击检测模型对训练数据重构以获取重构误差,并根据重构误差计算攻击检测阈值;实时在线获取ICPS的多源特征数集,将其最佳特征子集作为在线检测输入数据,并使用训练好的攻击检测模型重构,得到对应的重构误差;最终通过与攻击检测阈值进行比较,确定ICPS当前时刻是否受到攻击。本发明专利技术可以有效缩减系统数据的特征维度,并提升攻击检测的准确率。准确率。准确率。

【技术实现步骤摘要】
基于社区特征选择的ICPS无监督在线攻击检测方法和设备


[0001]本专利技术属于工业信息物理系统
,具体涉及一种基于社区特征选择的工业信息物理系统无监督在线攻击检测方法和设备。

技术介绍

[0002]近年来,由于计算、通信和物联网等相关技术的进步,信息物理系统(CPS)在工业领域得到了迅猛发展,并在石油化工、水利、能源、电力等关键工业领域得到了广泛应用,成为工业信息物理系统(ICPS)。区别于相对独立的传统工业控制系统(ICS),ICPS中信息空间和物理过程的紧密集成使得高效、节能和弹性的工业生产模式成为可能。然而,随着系统内部部件之间的互联性增加并接入外部网络环境,ICPS在开放的架构下更容易受攻击。攻击者试图通过网络层或物理层进行渗透,以破坏工艺装置或篡改关键控制器参数,导致闭环控制不稳定,并造成更严重的破坏,如经济利益的巨大损失、系统停机甚至安全人员伤亡等。近年来,针对ICPS的恶意攻击事件不断增加,造成了巨大的经济损失和严重的社会问题。ICPS的安全问题受到了前所未有的关注。
[0003]在ICPS安全研究中,攻击检测被视为保护系统免受恶意攻击的重要策略之一,其中最常用的方法是基于监控和数据采集(SCADA)系统收集的系统数据识别不符合系统预期行为的异常事件检测。近年来,随着机器学习(ML)、深度学习(DL)和强化学习(RL)等技术的迅速发展,大数据分析技术被广泛应用于基于数据驱动的攻击检测研究。事实上,开发基于人工智能算法的异常检测系统的一个重要因素就是找到合适的特征集来表征和描述系统的运行模式。否则,系统中的高通量、高维度数据很可能会导致统计模型出现指数爆炸和维度灾难等问题,也就是说,冗余和不相关的特征的存在不仅会导致模型在训练过程中计算复杂度和处理成本(包括离线训练时间和在线部署效率)的增加,还会导致分类器的性能下降。因此,特征选择是基于数据驱动的攻击检测方法的重点研究课题。
[0004]目前,尽管在特征选择方面已经有很多尝试,如粒子群优化、遗传算法和模拟退火,但通过特征选择处理冗余和无关信息仍然存在重大挑战,特别是在系统数据具有极高维度和相关性的工业场景中。事实上,ICPS的物理层通常是多变量、强耦合的复杂工业过程,系统数据具有不同程度的相关性。具有强过程敏感性的变量通常与其他变量密切相关,属于具有安全敏感性的关键变量,它们可以准确反映系统运行状态,对于系统的异常检测至关重要。因此,如何通过高维数据之间的相关性挖掘数据的潜在特征信息从而实现特征降维,对于基于数据驱动的安全检测研究具有重要的意义。
[0005]为了适应在高维数据下工业信息物理系统的安全监测,本专利开发了一种基于社区特征选择和自动编码器的ICPS无监督在线攻击检测方法。该方法主要分为离线阶段的特征约简和检测模型训练以及在线阶段的攻击检测两个部分。其中,在离线阶段的特征约简中,首先对多源特征数据集构建特征网络并进行网络修剪;然后,基于Louvain社区检测方法对特征网络进行自动划分,从而得到多个特征子集;最后,通过构建特征选择优化模型,基于最低误分类率标准得到能够准确表征和描述系统运行的关键特征子集,从而实现特征
约简。在检测模型训练中,首先构建基于自编码器的攻击检测模型,并采用系统历史正常数据对模型进行训练;然后,基于核密度估计方法对系统历史正常数据计算攻击检测阈值。在在线阶段的攻击检测中,首先对在线流式数据进行特征筛选;然后,把特征选择后的数据样本输入到自编码器分类模型中,得到重构误差;最后,通过比较重构误差与攻击检测阈值实现攻击检测。该方法可以基于系统历史正常运行数据自动提取多源特征间潜在的全局结构信息,从而得到准确表征和描述系统运行的关键特征子集,同时采用深度学习的自动编码器监测系统的运行状态,所提方法可以有效缩减系统数据的特征维度,并提升攻击检测的准确率,可实现在线保护工业信息物理系统运行安全,且能够适应未知攻击或高级可持续威胁,有望解决工业信息物理系统运行安全防护的瓶颈问题。

技术实现思路

[0006]为了适应在高维数据下工业信息物理系统的安全监测,本专利技术提供一种基于社区特征选择和自动编码器的ICPS无监督在线攻击检测方法,可以有效缩减系统数据的特征维度,并提升攻击检测的准确率。
[0007]为实现上述技术目的,本专利技术采用如下技术方案:
[0008]一种基于社区特征选择的ICPS无监督在线攻击检测方法,包括:
[0009]特征约简与训练数据获取:根据ICPS的历史多源特征数集构建特征网络,然后基于社区检测方法对特征网络进行自动划分得到多个特征子集,再基于最低误分类率标准选择最佳特征子集,并将历史多源特征数集的最佳特征子集作为训练数据;
[0010]模型训练与攻击检测阈值计算:构建基于自编码器的攻击检测模型,使用训练数据作为输入和输出对攻击检测模型进行训练;然后使用训练好的攻击检测模型对训练数据进行重构进而获取对应的重构误差,再基于核密度估计方法根据重构误差计算攻击检测阈值;
[0011]在线攻击检测:实时在线获取ICPS的多源特征数集,将其最佳特征子集作为在线检测输入数据;然后使用训练好的攻击检测模型对在线检测输入数据进行重构,进而得到对应的重构误差;最终将在线检测输入数据的重构误差与攻击检测阈值进行比较,确定ICPS当前时刻是否受到攻击。
[0012]进一步的,所述多源特征数集是指M个传感器收集的数据;所述历史多源特征数集,包括M个传感器分别收集N个数据;实时在线获取的金源特征数集,包括M个传感器分别收集到的当前时刻的数据。
[0013]进一步的,将历史多源特征数集表示为X=[x1,x2,...,x
M
]∈R
N
×
M
,其中x
i
∈R
N
, i=1,2,...,M,x
i
表示第i个传感器收集的N个数据样本,M表示ICPS的传感器个数;则构建特征网络的方法为:
[0014]步骤A1,定义有权无向图G=(V,E,W)的节点集合为V={x
i
|i=,1,2,...,M},连边集合为 E={(x
i
,x
j
):x
i
,x
j
∈V};i,j用于区分不同的传感器节点;
[0015]步骤A2,计算权重集合W={w
ij
|i,j=,1,2,...,M},其中w
ij
定义为两个传感器节点x
i
和x
j
之间的相似性测度,采用皮尔森相关性进行计算,即:
[0016][0017]其中,和分别为向量x
i
和x
j
的平均值。因此,得到有权无向图G=(V,E,W)的权重矩阵,即
[0018][0019]步骤A3:定义阈值η,用于对有权无向网络G=(V,E,W)的权重元素进行修剪,即
[0020][0021]由此将有权无向图G转化为无权无向图G本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于社区特征选择的ICPS无监督在线攻击检测方法,其特征在于,包括:特征约简与训练数据获取:根据ICPS的历史多源特征数集构建特征网络,然后基于社区检测方法对特征网络进行自动划分得到多个特征子集,再基于最低误分类率标准选择最佳特征子集,并将历史多源特征数集的最佳特征子集作为训练数据;模型训练与攻击检测阈值计算:构建基于自编码器的攻击检测模型,使用训练数据作为输入和输出对攻击检测模型进行训练;然后使用训练好的攻击检测模型对训练数据进行重构进而获取对应的重构误差,再基于核密度估计方法根据重构误差计算攻击检测阈值;在线攻击检测:实时在线获取ICPS的多源特征数集,将其最佳特征子集作为在线检测输入数据;然后使用训练好的攻击检测模型对在线检测输入数据进行重构,进而得到对应的重构误差;最终将在线检测输入数据的重构误差与攻击检测阈值进行比较,确定ICPS当前时刻是否受到攻击。2.根据权利要求1所述的方法,其特征在于,所述多源特征数集是指M个传感器收集的数据;所述历史多源特征数集,包括M个传感器分别收集历史N个采样点的数据;实时在线获取的金源特征数集,包括M个传感器分别收集当前时刻的数据。3.根据权利要求1所述的方法,其特征在于,将历史多源特征数集表示为X=[x1,x2,...,x
M
]∈R
N
×
M
,其中x
i
∈R
N
,i=1,2,...,M,x
i
表示第i个传感器收集的N个数据样本,M表示ICPS的传感器个数;则构建特征网络的方法为:步骤A1,定义有权无向图G=(V,E,W)的节点集合为V={x
i
|i=,1,2,...,M},连边集合为E={(x
i
,x
j
):x
i
,x
j
∈V};i,j用于区分不同的传感器节点;步骤A2,计算权重集合W={w
ij
|i,j=,1,2,...,M},其中w
ij
定义为两个传感器节点x
i
和x
j
之间的相似性测度,采用皮尔森相关性进行计算,即:其中,和分别为向量x
i
和x
j
的平均值。因此,得到有权无向图G=(V,E,W)的权重矩阵,即步骤A3:定义阈值η,用于对有权无向网络G=(V,E,W)的权重元素进行修剪,即由此将有权无向图G转化为无权无向图G
*
,且无权无向图G
*
的节点集合V
*
={x
i
|i=,1,2,...,M}的连边集合E
*
={(x
i
,x
j
):x
i
,x
j
∈V
*
}表示为连边矩阵:
其中,表示数据集X=[x1...

【专利技术属性】
技术研发人员:阳春华邓文锋黄科科李勇刚朱红求李繁飙桂卫华
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1