当前位置: 首页 > 专利查询>云南大学专利>正文

一种配电网信息系统的入侵检测方法和系统技术方案

技术编号:37064303 阅读:17 留言:0更新日期:2023-03-29 19:42
本申请公开了一种配电网信息系统的入侵检测方法和系统,该方法包括以下步骤:获取配电网信息系统全景数据;对所述配电网信息系统全景数据进行预处理,并将所述配电网信息系统全景数据划分为训练集、验证集和测试集;建立随机森林入侵检测模型,并根据所述训练集、所述验证集和所述测试集,为所述随机森林入侵检测模型寻找最佳超参数组;根据所述最佳超参数组确定配电网信息系统是否存在网络攻击。本申请实施例解决了数据不平衡的问题,能够更全面有效的获取实时数据特征,从而改善了配电网信息系统的安全运行状况,且处理速度较快,算法开销和计算代价较小。开销和计算代价较小。开销和计算代价较小。

【技术实现步骤摘要】
一种配电网信息系统的入侵检测方法和系统


[0001]本申请属于计算机
,具体涉及一种配电网信息系统的入侵检测方法和系统。

技术介绍

[0002]随着电网信息化和网络化的发展,配电网信息系统的安全正面临着严峻的挑战。配电是电力系统的重要环节,它直接面向电力用户,承担电力用户的供电服务,人们对配电网信息系统的可靠性和供电质量有了更高的要求。因此,对配电网信息系统进行入侵检测是提高配电网供电可靠性的重要手段。
[0003]近年来,学者们已经使用了各种不同的基于机器学习的配电网信息系统入侵检测方法,尝试提取特定的模式,从而实现对异常数据的检测。Hussain等人提出一种两阶段混合分类方法,分别采用支持向量机和人工神经网络进行配电网信息系统入侵检测。MA等人采用光谱聚类从网络流量中提取特征,并使用多层神经网络检测配电网信息系统攻击类型。Erfani等人提出一个混合模型,把深度置信网络与一个单类向量机结合在一起,提高了配电网信息系统入侵检测分类效果。
[0004]然而,现有的配电网信息系统入侵检测方法,仍然存在一些问题:算法开销时间大,存在一定的局限性。神经网络所需的计算能力在很大程度上取决于数据的大小,也取决与网络的深度和复杂程度,相比之下,融合神经网络的配电网信息系统入侵检测模型的处理速度较慢,算法开销过大,计算代价高昂。现有的入侵检测模型的超参数配置主要是通过手动搜索来完成的,而手动搜索要求使用者具有专业的背景只是和实践经验,这使得调整超参数的过程不易重现。与此同时,随着超参数的数量和值的范围增加,由于大多数人不善于处理高维数据并且容易误解或错过超参数的趋势和关系,所以该过程变得难以管理。
[0005]申请内容
[0006]本申请实施例的目的是提供一种配电网信息系统的入侵检测方法和系统,以解决现有技术处理速度较慢且算法开销过大的缺陷。
[0007]为了解决上述技术问题,本申请是这样实现的:
[0008]第一方面,提供了一种配电网信息系统的入侵检测方法,包括以下步骤:
[0009]获取配电网信息系统全景数据;
[0010]对所述配电网信息系统全景数据进行预处理,并将所述配电网信息系统全景数据划分为训练集、验证集和测试集;
[0011]建立随机森林入侵检测模型,并根据所述训练集、所述验证集和所述测试集,为所述随机森林入侵检测模型寻找最佳超参数组;
[0012]根据所述最佳超参数组确定配电网信息系统是否存在网络攻击。
[0013]第二方面,提供了一种配电网信息系统的入侵检测系统,包括:
[0014]获取模块,用于获取配电网信息系统全景数据;
[0015]处理模块,用于对所述配电网信息系统全景数据进行预处理,并将所述配电网信
息系统全景数据划分为训练集、验证集和测试集;
[0016]构建模块,用于建立随机森林入侵检测模型,并根据所述训练集、所述验证集和所述测试集,为所述随机森林入侵检测模型寻找最佳超参数组;
[0017]检测模块,用于根据所述最佳超参数组确定配电网信息系统是否存在网络攻击。
[0018]本申请实施例使用配电网信息系统全景数据,通过搜寻随机森林学习算法的最优超参数组,确定配电网信息系统是否存在被网络攻击的可能性,充分考虑了攻击配电网多种变量之间的相关性,解决了数据不平衡的问题,能够更全面有效的获取实时数据特征,从而改善了配电网信息系统的安全运行状况,且处理速度较快,算法开销和计算代价较小。
附图说明
[0019]图1是本申请实施例提供的一种配电网信息系统的入侵检测方法流程图;
[0020]图2是本申请实施例提供的配电网信息系统的入侵检测方法的一种具体实现图;
[0021]图3是本申请实施例提供的一种配电网信息系统的入侵检测系统的结构示意图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]现有的配电网信息系统入侵检测方法,未考虑配电网信息系统数据不平衡,配电网信息系统数据不平衡问题严重影响配电网信息系统入侵检测建模与训练。配电网络入侵检测环境中不同类别样本的数量存在严重的不平衡问题,某些攻击类型的样本数量非常小,这样训练出来的模型容易出现高误报和漏报的情况。通过欠采样的方法对不平衡数据进行处理容易丢失多数类样本信息导致模型对多数类分类精度下降。传统的过采样方法则是通过插值运算进行样本的过采样,容易制造出冗余的数据样本增加模型的训练难度。随着配电网的发展,越来越多的网络入侵攻击方式不断走向智能化和多样化,传统的采样方法不适用于配电网不平衡数据的处理。
[0024]本申请实施例的目的在于克服上述现有方法的不足,提供一种针对配电网信息系统入侵检测的方法,具体为一种基于超参数寻优随机森林的配电网信息系统入侵检测方法。本申请实施例所采用的检测方法为:首先,结合配电网网架拓扑、开关状态、设备参数、客户负荷、运行状态和设备历史运行数据搭建配电网信息系统全景数据库,具体来说包括:三项电压、三项电流、功率因素、有功功率、无功功率、有功电能等。其次,对获取的配电网信息系统全景数据进行Borderline

SMOTE+Tomek Links混合采样。接着,采样后的配电网信息系统全景数据进行MIN

MAX归一化处理,并将数据分为训练集、验证集和测试集。最后,基于配电网信息系统数据库实现数字化建模,把一种基于超参数寻优随机森林的配电网信息系统入侵检测方法应用于配电网信息系统中,实现网络非法入侵告警。
[0025]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的配电网信息系统的入侵检测方法进行详细地说明。
[0026]如图1所示,为本申请实施例提供的一种配电网信息系统的入侵检测方法流程图,
该方法包括以下步骤:
[0027]步骤101,获取配电网信息系统全景数据。
[0028]具体地,可以搭建由配电网信息系统全景数据构成的配电网信息系统全景数据库。其中,配电网信息系统全景数据包括配电网网架拓扑、开关状态、设备参数、客户负荷、运行状态和设备历史运行数据。
[0029]步骤102,对所述配电网信息系统全景数据进行预处理,并将所述配电网信息系统全景数据划分为训练集、验证集和测试集。
[0030]具体地,可以对所述配电网信息系统全景数据进行混合采样和归一化处理,并将处理后的配电网信息系统全景数据划分为训练集、验证集和测试集。
[0031]本实施例中,可以对所述配电网信息系统全景数据中的边界样本进行分类,并根据所述边界样本的分布状态,对所述配电网信息系统全景数据中的边界少类样本进行合成;根据新合成数据集中的两个样本点之间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种配电网信息系统的入侵检测方法,其特征在于,包括以下步骤:获取配电网信息系统全景数据;对所述配电网信息系统全景数据进行预处理,并将所述配电网信息系统全景数据划分为训练集、验证集和测试集;建立随机森林入侵检测模型,并根据所述训练集、所述验证集和所述测试集,为所述随机森林入侵检测模型寻找最佳超参数组;根据所述最佳超参数组确定配电网信息系统是否存在网络攻击。2.根据权利要求1所述的方法,其特征在于,所述配电网信息系统全景数据包括配电网网架拓扑、开关状态、设备参数、客户负荷、运行状态和设备历史运行数据。3.根据权利要求1所述的方法,其特征在于,所述获取配电网信息系统全景数据,具体包括:搭建由所述配电网信息系统全景数据构成的配电网信息系统全景数据库;所述对所述配电网信息系统全景数据进行预处理,具体包括:对所述配电网信息系统全景数据进行混合采样和归一化处理。4.根据权利要求1所述的方法,其特征在于,所述对所述配电网信息系统全景数据进行预处理,具体包括:对所述配电网信息系统全景数据中的边界样本进行分类,并根据所述边界样本的分布状态,对所述配电网信息系统全景数据中的边界少类样本进行合成;根据新合成数据集中的两个样本点之间的距离,判断所述两个样本点能否形成Tomek Links对,若能形成,则确定所述两个样本点中的一个样本为噪声,并删除所述样本;若不能形成,则确定所述两个样本点为安全样本。5.根据权利要求1所述的方法,其特征在于,还包括:实时动态更新所述配电网信息系统全景数据。6.一种配电网信息系统的入侵检测系...

【专利技术属性】
技术研发人员:李鹏陆孝锋王永雪王昊宇仝瑞宁王瀚铖佘应森张昱豪张瀚文
申请(专利权)人:云南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1