一种基于GEP-CNN的电网恶意数据注入检测方法技术

技术编号:24708422 阅读:16 留言:0更新日期:2020-07-01 00:01
一种基于GEP‑CNN的电网恶意数据注入检测方法,在数据量大、维度多、数据种类多的电力系统中,能够利用现有的大数据信息及时准确的检测出电网中是否存在恶意数据注入攻击,其主要包括三个部分:神经网络优化器、样本训练器、检测分类器。本发明专利技术将GEP算法加入CNN网络中,构建一个GEP‑CNN混合网络,利用GEP算法的全局搜索能力对CNN网络的初始权重进行优化,避免了卷积神经网络在学习训练过程中陷入局部最优,同时提高了神经网络学习训练的准确性。然后利用历史数据库中的历史数据进行学习训练,得到攻击数据特征库,最后对采集到的实时数据进行检测分类。以此实现电网中恶意数据的有效检测,保证电网的安全稳定运行。

【技术实现步骤摘要】
一种基于GEP-CNN的电网恶意数据注入检测方法
本专利技术是一种基于GEP-CNN的电网恶意数据注入检测方法,主要用于解决电网中恶意数据注入攻击检测问题,属于信息安全问题。
技术介绍
随着电力系统的快速发展,先进的通信技术以及控制技术等开始应用到电力系统中,电力系统与信息控制设备和通信网络的融合,使得电网中的大量数据得到了实时分析和处理,电力资源得到更高效的利用,但是通信网络和信息设备等在带来便利的同时,也带来了一些安全漏洞,电力系统遭受网络攻击入侵的几率也大大增加。电力系统中的网络攻击可以按照攻击目标分为破坏信息可用性、完整性和保密性。其中,恶意数据注入攻击通过篡改系统量测数据并以破坏电网信息完整性作为攻击方式。具有较强的屏蔽性与干扰性,能够影响控制中心的分析决策并造成严重的后果。对于恶意数据注入攻击,常用状态估计算法进行检测,常用的传统电力系统状态估计算法有加权最小二乘法、快速分解状态估计以及路量测变换法状态估计算法等,加权最小二乘法模型简单,但是计算需要大量内存,对于大型电力系统并不适用,快速分解状态对比值较小的低压电网估计较差,而线路量测变换法对于节点注入型的量测数据并不能很好的进行处理。由此可见,传统的状态估计算法不能完美解决电力系统中恶意数据注入攻击的检测问题,因此,现阶段亟需专利技术一种有效的针对电网恶意数据攻击的检测方法,可以有效、准确的检测出电网中的恶意数据攻击。基于GEP-CNN的电网恶意数据注入检测方法主要需考虑两个方面的问题:(1)如何从大量数据中提取攻击数据特征库,并准确的区分攻击数据与正常数据。2)如何保证在识别完电网中恶意数据攻击后,最大化保证原有数据的特征性和完整性。
技术实现思路
本专利技术的目的就是提供一种基于GEP-CNN的电网恶意注入检测方法,来解决电网中对恶意数据注入攻击的检测问题,本机制是一种策略性方法,通过本方法可以使得电网中的恶意数据注入攻击得到快速有效的检测,保证了电网的安全稳定运行。一种基于GEP-CNN的电网恶意数据注入检测方法,所述方法包括如下步骤:步骤1,从电网的数据采集与监控系统SCADA中提取历史数据,作为原始训练样本;步骤2,对卷积神经神经网络进行优化,将卷积神经神经网络的卷积层和全连接层的初始权重进行种群初始化处理,将训练分类器的准确率作为评判标准,利用GEP的遗传迭代的方法对初始权重进行寻优,以此得到最合适的初始权重,得到优化后的卷积神经网络;步骤3,将原始训练样本进行预处理,作为训练样本,并用该训练样本对优化后的卷积神经网络进行学习训练以得到合适的虚假数据注入攻击特征库,将其作为电网假数据注入检测的判断器;步骤4,通过SCADA系统采集电网里的实时数据,作为原始量测集,对原始量测集进行去均值以及归一化处理后作为监测数据,输入到卷积神经网络中,最后通过Softmax分类器输出其属于每一类的概率,以此来判断是否存在恶意数据注入攻击。进一步地,所述步骤2包括如下分步骤:步骤2-1,对卷积神经网络的卷积层和全连接层的权重做初始化种群处理,初始种群记做pop,并对初始种群进行解码;步骤2-2,计算训练后卷积神经网络分类器的分类正确率,记做qi,作为第i条染色体的值;步骤2-3,通过相对误差公式计算相应染色体的适应度,计算第i条适应度fi,即:其中M是选择范围,C(i,j)是第i条染色体对于适应度样本j的值,来自集合Cr中,即步骤2-2的qi,Tj是适应样本j的目标值,进入步骤6;步骤2-4,保留上一代种群里的最优个体,同时用轮盘赌算法进行下一代种群个体的选择,对种群个体进行基因突变,重组,转座,产生下一代种群,记做new-pop,进入步骤7;步骤2-5,设置适应度阈值Φ,当某一代种群中有染色体的适应度达到阈值Φ时,终止遗传进化;判断产生的new-pop是否满足进化上述终止条件,若不满足,则返回步骤2-4;若满足,则保留该种群里的最优个体,将该组权重作为卷积层和全连接层的最优权重。进一步地,所述步骤2中,设定待训练的卷积神经网络的卷积层数量为K,卷积掩膜的尺寸为1×d'。进一步地,所述步骤2-1中,对卷积层以及全连接层的权重做初始化,生成初始种群pop,其中单条染色体中的基因个数设置为条,其中表示卷积层总的权重数量,全连接层只有一个权重。进一步地,所述步骤4包括如下分步骤:步骤4-1,利用终端采集单元采集实时数据,作为原始量测数据集;步骤4-2,对原始量测数据集{Zi}进行预处理,将量测值处理成多维矩阵Z,即:其中n表示量测向量的个数;步骤4-3,将步骤4-2中的数据作为训练后的卷积神经网络的输入并对数据做去均值和归一化处理;步骤4-4,将步骤4-3中处理后的输入层数据输入训练后的卷积神经网络的卷积层中,经过卷积层处理后再输入到池化层中;步骤4-5,经过多次步骤4-4后,将所得数据输入到最后的全连接层中,并通过Softmax分类器进行分类输出结果,若分类为异常数据则触发报警模块,分类为正常数据则不做处理。进一步地,所述步骤4-3中,通过用线性函数变换法对数据集进行归一化处理,即:式中,A(m,n)为归一化处理前的值,A'(m,n)为处理后的值,HUmax,HUmax分别是最大亨氏值以及最小亨氏值。进一步地,所述步骤4-5中,Softmax函数将属于各个类别的概率作为输出,以此来判别输入的类别,Softmax回归将样本x(i)标记为类别j的概率为:其中,x(i)为训练样本,y(i)为样本对应的标签,θ为训练的模型参数,通过输出的概率来检测是否为异常数据。本专利技术达到的有益效果为:提出了一种基于GEP-CNN的电网恶意数据注入检测方法,主要用于解决电网中恶意数据入侵的有效识别问题,通过使用本专利技术中提出的方法可以根据当前有电网中的大量数据,利用基因表达式编程算法和卷积神经网络相结合,并且利用Softmax分类算法对有源配电网下恶意入侵数据进行有效识别,从而很好地保证有源配电网安全可靠的运行。附图说明图1是本专利技术实施例中所述检测方法的结构框图图。图2是本专利技术实施例中所述检测方法的体系示意图。图3是本专利技术实施例中所述检测方法的流程示意图。具体实施方式下面结合说明书附图对本专利技术的技术方案做进一步的详细说明。图1给出了基于GEP-CNN的电网恶意数据注入检测方法的结构图,主要包括三个部分:神经网络优化器、样本训练器、检测分类器。图中神经网络优化器是利用基因表达式编程(GEP)的全局搜索对神经网络卷积层和全连接层的初始权重进行寻优,得到最优的初始权重;样本训练器是将电网历史数据作为训练样本,利用优化后的卷积神经网络进行训练,提取数据攻击特征库;检测分类器是用训练好的神经网络对电网的实时数据进行检测,将检测后的输出结果用Softmax分类器进行分类,进而检测出恶意攻击数据。下面给出具体介绍:...

【技术保护点】
1.一种基于GEP-CNN的电网恶意数据注入检测方法,其特征在于:所述方法包括如下步骤:/n步骤1,从电网的数据采集与监控系统SCADA中提取历史数据,作为原始训练样本;/n步骤2,对卷积神经神经网络进行优化,将卷积神经神经网络的卷积层和全连接层的初始权重进行种群初始化处理,将训练分类器的准确率作为评判标准,利用GEP的遗传迭代的方法对初始权重进行寻优,以此得到最合适的初始权重,得到优化后的卷积神经网络;/n步骤3,将原始训练样本进行预处理,作为训练样本,并用该训练样本对优化后的卷积神经网络进行学习训练以得到合适的虚假数据注入攻击特征库,将其作为电网假数据注入检测的判断器;/n步骤4,通过SCADA系统采集电网里的实时数据,作为原始量测集,对原始量测集进行去均值以及归一化处理后作为监测数据,输入到卷积神经网络中,最后通过Softmax分类器输出其属于每一类的概率,以此来判断是否存在恶意数据注入攻击。/n

【技术特征摘要】
1.一种基于GEP-CNN的电网恶意数据注入检测方法,其特征在于:所述方法包括如下步骤:
步骤1,从电网的数据采集与监控系统SCADA中提取历史数据,作为原始训练样本;
步骤2,对卷积神经神经网络进行优化,将卷积神经神经网络的卷积层和全连接层的初始权重进行种群初始化处理,将训练分类器的准确率作为评判标准,利用GEP的遗传迭代的方法对初始权重进行寻优,以此得到最合适的初始权重,得到优化后的卷积神经网络;
步骤3,将原始训练样本进行预处理,作为训练样本,并用该训练样本对优化后的卷积神经网络进行学习训练以得到合适的虚假数据注入攻击特征库,将其作为电网假数据注入检测的判断器;
步骤4,通过SCADA系统采集电网里的实时数据,作为原始量测集,对原始量测集进行去均值以及归一化处理后作为监测数据,输入到卷积神经网络中,最后通过Softmax分类器输出其属于每一类的概率,以此来判断是否存在恶意数据注入攻击。


2.根据权利要求1所述一种基于GEP-CNN的电网恶意数据注入检测方法,其特征在于:所述步骤2包括如下分步骤:
步骤2-1,对卷积神经网络的卷积层和全连接层的权重做初始化种群处理,初始种群记做pop,并对初始种群进行解码;
步骤2-2,计算训练后卷积神经网络分类器的分类正确率,记做qi,作为第i条染色体的值;
步骤2-3,通过相对误差公式计算相应染色体的适应度,计算第i条适应度fi,即:



其中M是选择范围,C(i,j)是第i条染色体对于适应度样本j的值,来自集合Cr中,即步骤2-2的qi,Tj是适应样本j的目标值,进入步骤6;
步骤2-4,保留上一代种群里的最优个体,同时用轮盘赌算法进行下一代种群个体的选择,对种群个体进行基因突变,重组,转座,产生下一代种群,记做new-pop,进入步骤7;
步骤2-5,设置适应度阈值Φ,当某一代种群中有染色体的适应度达到阈值Φ时,终止遗传进化;判断产生的new-pop是否满足进化上述终止条件,若不满足,则返回步骤2-4;若满足,则保留该种群里的最优个体,将该组权重作为卷积层和全连接层的最优权重。

<...

【专利技术属性】
技术研发人员:邓松袁新雅陈福林岳东蔡清嫄董霞张建堂祝展望
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1