一种电气互联系统虚假数据注入攻击检测方法及装置制造方法及图纸

技术编号:38138893 阅读:6 留言:0更新日期:2023-07-08 09:52
本发明专利技术公开了一种电气互联系统虚假数据注入攻击检测方法及装置,该方法包括:提取电气互联系统的节点状态变量构建数据集;将所述数据集进行Bootstrap抽样得到训练集和测试集;计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简;利用精简后的训练集进行训练生成随机森林模型;将测试集数据输入所述随机森林模型,根据所述随机森林模型的输出确定虚假数据注入攻击检测结果。林模型的输出确定虚假数据注入攻击检测结果。林模型的输出确定虚假数据注入攻击检测结果。

【技术实现步骤摘要】
一种电气互联系统虚假数据注入攻击检测方法及装置


[0001]本专利技术涉及一种电气互联系统虚假数据注入攻击检测方法及装置,具体是一种基于改进随机森林算法的电气互联系统FDIA攻击检测方法。

技术介绍

[0002]综合能源系统如今融合了多能源技术和网络技术,组成了由智能仪表、传感器和计算技术等有机联合的整体。正由于系统的高度复杂度,使系统遭受各方面攻击的几率大大提高。虚假数据注入攻击(FDIA)的概念最初是在智能电网领域引入的。虽然这个术语听起来很常见,但它具体指的是攻击者以一种不容易被发现的方式破坏传感器读数,从而将未检测到的错误引入到状态变量和值的计算中。由于电网和气网、热网的联系密切,FDIA逐渐侵入综合能源系统,必须提高防范意识,完善防范网络攻击的机制。

技术实现思路

[0003]目的:为了克服现有技术中存在的不足,本专利技术公开一种电气互联系统虚假数据注入攻击检测方法及装置,通过电气互联系统中提取的特征向量生成训练集和测试集,在训练集的取样中加入权重的考虑,然后根据随机森林算法对特征向量进行判断,是否受到了虚假数据注入攻击。
[0004]技术方案:为解决上述技术问题,本专利技术采用的技术方案为:
[0005]第一方面,本专利技术提供一种电气互联系统虚假数据注入攻击检测方法,包括:
[0006]提取电气互联系统的节点状态变量构建数据集;
[0007]将所述数据集进行Bootstrap抽样得到训练集和测试集;
[0008]计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简;
[0009]利用精简后的训练集进行训练生成随机森林模型;
[0010]将测试集数据输入所述随机森林模型,根据所述随机森林模型的输出确定虚假数据注入攻击检测结果。
[0011]在一些实施例中,所述电气互联系统的节点状态变量包括电网的节点电压、有功功率、气网的节点进出流量和压力。
[0012]在一些实施例中,将数据集进行Bootstrap抽样得到与原数据集分布相似的训练集D和测试集。
[0013]在一些实施例中,计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简,包括:
[0014]设训练集D中第k类样本所占比例为p
k
,k=1,2,

,n,训练集D的信息熵Ent(D)定义为:
[0015][0016]设离散属性a有V个可能的取值{a1,a2,

,a
V
},用a对训练集D来划分,产生v个子集,第v个子集中包含D中所有在属性a上取值为a
V
的样本,记为D
v
,计算出D
v
的信息熵;
[0017]不同子集包含的样本数不同,给子集赋予权重即样本越多的子集影响越大;计算出用属性a对训练集D进行划分得到的信息增益Gain(D,a):
[0018][0019]根据训练集D上第j个特征a
j
,1≤j≤K;计算出每个特征a
j
在训练集D下的信息增益Gain(D,a
j
),由此得到K个信息增益值,对K个信息增益值进行归一化处理,得到每个特征的权重w
j

[0020][0021]得到所有特征的权重之后,选择权重较大的前M个特征,作为精简后的训练集数据特征组成。
[0022]在一些实施例中,利用精简后的训练集进行训练生成随机森林模型,包括:
[0023]S401、从精简后的训练集中随机抽取N个样本,对每个样本的f个特征的基尼指数进行计算;
[0024]S402、根据计算得到的特征的基尼指数建立决策树;
[0025]S403、重复步骤S401至步骤S402,直至决策树数目达到设定要求;
[0026]S404、基于所有的决策树生成随机森林模型。
[0027]进一步地,在一些实施例中,对每个样本的f个特征的基尼指数进行计算包括:
[0028][0029]其中,Gini(p)代表样本特征的基尼指数,F代表样本特征种类,p
f
代表样本根据第f个特征分类正确的概率。
[0030]在一些实施例中,将测试集数据输入所述随机森林模型,根据所述随机森林模型的输出确定虚假数据注入攻击检测结果,包括:将测试集中的数据逐个放进随机森林中进行划分,当节点状态子集个数v=1时,判断该数据为异常数据,则电气互联系统的该节点受到了虚假数据注入攻击。
[0031]第二方面,本专利技术提供了一种电气互联系统虚假数据注入攻击检测系统,包括:
[0032]节点状态变量提取模块,被配置为:提取电气互联系统的节点状态变量构建数据集;
[0033]数据集抽样模块,被配置为:将所述数据集进行Bootstrap抽样得到训练集和测试集;
[0034]训练集数据特征精简模块,被配置为:计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简;
[0035]模型生成模块,被配置为:利用精简后的训练集进行训练生成随机森林模型;
[0036]攻击检测模块,被配置为:将测试集数据输入所述随机森林模型,根据所述随机森林模型的输出确定虚假数据注入攻击检测结果。
[0037]第三方面,本专利技术提供了一种电气互联系统虚假数据注入攻击检测装置,包括处理器及存储介质;
[0038]所述存储介质用于存储指令;
[0039]所述处理器用于根据所述指令进行操作以执行根据第一方面所述方法的步骤。
[0040]第四方面,本专利技术提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述方法的步骤。
[0041]有益效果:
[0042]本专利技术提供的一种基于改进随机森林算法的电气互联系统虚假数据注入攻击检测方法及装置,具有以下优点:随机森林算法是一种常用且有效的分类方法。用机器学习算法对电气互联系统的FDIA攻击进行检测时,可将问题视作一个二分类问题,即系统是否遭受攻击,而不需设置阈值来判断。但在数据集的抽样中,随机森林算法是对样本进行随机的有放回抽样,而数据集存在大占比类型和小占比类型,会降低小占比类别的分类精度。因此对随机森林方法进行改进,不再随机抽样,而是根据权重,选取对分类影响大的特征向量,降低了计算量,提高了计算精度。本方法对电气互联系统遭受的FDIA攻击进行检测,检测成功率更高,为我国综合能源系统安全助力。
附图说明
[0043]图1是本专利技术实施例提供的一种基于改进随机森林算法的电气互联系统虚假数据注入攻击检测方法流程图。
具体实施方式
[0044]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电气互联系统虚假数据注入攻击检测方法,其特征在于,包括:提取电气互联系统的节点状态变量构建数据集;将所述数据集进行Bootstrap抽样得到训练集和测试集;计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简;利用精简后的训练集进行训练生成随机森林模型;将测试集数据输入所述随机森林模型,根据所述随机森林模型的输出确定虚假数据注入攻击检测结果。2.根据权利要求1所述的一种电气互联系统虚假数据注入攻击检测方法,其特征在于,所述电气互联系统的节点状态变量包括电网的节点电压、有功功率、气网的节点进出流量和压力。3.根据权利要求1所述的一种电气互联系统虚假数据注入攻击检测方法,其特征在于,将数据集进行Bootstrap抽样得到与原数据集分布相似的训练集D和测试集。4.根据权利要求1所述的一种电气互联系统虚假数据注入攻击检测方法,其特征在于,计算训练集中每个特征的权重,根据计算得到的权重对训练集数据特征进行精简,包括:设训练集D中第k类样本所占比例为p
k
,k=1,2,

,n,训练集D的信息熵Ent(D)定义为:设离散属性a有V个可能的取值{a1,a2,

,a
V
},用a对训练集D来划分,产生v个子集,第v个子集中包含D中所有在属性a上取值为a
V
的样本,记为D
v
,计算出D
v
的信息熵;不同子集包含的样本数不同,给子集赋予权重即样本越多的子集影响越大;计算出用属性a对训练集D进行划分得到的信息增益Gain(D,a):根据训练集D上第j个特征a
j
,1≤j≤K;计算出每个特征a
j
在训练集D下的信息增益Gain(D,a
j
),由此得到K个信息增益值,对K个信息增益值进行归一化处理,得到每个特征的权重w
j
:得到所有特征的权重之后,选择权重较大的前M个特征,作为精简后的训练集数...

【专利技术属性】
技术研发人员:朱庆陆震军张宇峰林慧婕仲志强刘永春宋杰陈良亮俞航陈毓春李泽煜杨志家宋纯贺方佳伟
申请(专利权)人:国电南瑞科技股份有限公司中国科学院沈阳自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1