一种电力数据网流量异常检测方法、系统及电子设备技术方案

技术编号:25761935 阅读:32 留言:0更新日期:2020-09-25 21:09
本发明专利技术提供一种电力数据网流量异常检测方法、系统及电子设备,方法包括:将电力数据网的流量特征数据输入LightGBM模型,输出电力数据网的流量特征数据对应的正常或异常结果,LightGBM模型为根据电力数据网的训练集训练而来,其中,利用贝叶斯优化算法确定模型的最佳超参组合,LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来。本发明专利技术将贝叶斯优化算法与LightGBM模型融合,利用贝叶斯优化算法确定LightGBM模型的最佳超参组合,对于LightGBM模型中的多个弱分类器进行权重的分配,提高LightGBM模型的整体分类效果,提高电力数据网中流量异常检测准确率和效率。

【技术实现步骤摘要】
一种电力数据网流量异常检测方法、系统及电子设备
本专利技术属于流量异常检测
,尤其涉及一种电力数据网流量异常检测方法、系统及电子设备。
技术介绍
随着电力通信的发展,数据网已成为电力通信的重要的业务承载平台,数据网络规模越来越大,网络结构复杂,承载业务信息越来越多。网络流量中包含了大量的信息,网络流量异常是网络空间遭受攻击的表现形式,因此如何能够迅速、准确的检测中网络流量异常,并且减少检测模型训练的人工成本开销成为网络技术发展的重要问题。目前对于数据网络流量异常检测主要有:第一种,采用增量k-均值聚类方法实时在线对流量异常进行分类,能够实现在线检测流量异常。第二种,基于贝叶斯分类器分析的异常检测方法,根据不同类型的网络异常动态选择用于异常检测的特征子集,最后利用贝叶斯分类器根据特征子集对未知样本进行类别预测。动态特征选择算法可以针对不同类型的异常动态的选择出用于检测该异常的最优特征子集,有助于降低用于检测异常的流量特征维数,提高异常检测的准确率。第三种,基于改进K-means算法的网络安全性验证,其将数据挖掘方法引入到对网络攻击特征的提取中来,首先通过创建高度可受控的靶场验证环境来监控进出系统的流量,再利用分层机制来逐层捕获进出系统的异常流量和异常行为,最后使用改进后的K-means算法对收集到的情报数据进行特征分析处理,从而能够高效的对攻击行为进行检测、准确的发现网络中潜在的未知攻击。其中,增量k-均值聚类算法开始的k值很难估计,聚类中心的随机选择对算法结果的影响较大;模型训练计算量大,消耗成本高;贝叶斯分类器对于测试集中的一个类别变量特征,如果在训练集中未出现过,对于未知流量特征数据的预测概率为0,即预测功能失效。K-means算法参数维度高,需要相关人员参与到算法模型建立的各个步骤中,在数据通信网的检测算法需要随数据的变化增量训练检测模型的情境下,该算法自动化程度不高,在需要增量更新分类模型的情境下表现不好。
技术实现思路
为克服上述现有电力数据网流量异常检测效果准确率低的问题或者至少部分地解决上述问题,本专利技术实施例提供一种电力数据网流量异常检测方法、系统及电子设备。根据本专利技术实施例的第一方面,提供一种电力数据网流量异常检测方法,包括:将采集的电力数据网的流量特征数据输入LightGBM模型中,由所述LightGBM模型输出所述电力数据网的流量特征数据对应的正常或异常结果;其中,所述LightGBM模型为根据电力数据网的训练集训练而来,所述训练集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;其中,利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来。在上述技术方案的基础上,本专利技术实施例还可以做如下改进。可选的,所述利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合包括:设置LightGBM模型的初始超参组合,按照所述初始超参组合,将测试集输入所述LightGBM模型中,由LightGBM模型输出测试结果,所述测试集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;计算所述测试结果与实际结果之间的损失;根据所述损失确定下一轮迭代的超参组合;重复迭代过程,直到计算出来的损失在预设损失阈值范围之内或者迭代次数达到上限,得到最佳超参组合。可选的,所述根据所述损失确定下一轮迭代的超参组合包括:根据所述初始超参组合和对应的损失,建立损失与初始超参组合之间的函数关系;根据损失与初始超参组合之间的函数关系,利用采集函数从所述初始超参组合中确定下一轮的超参组合。可选的,所述根据所述初始超参组合和对应的损失,计算损失与初始超参组合之间的函数关系还包括:根据每一轮的超参组合及对应的损失,对建立的损失与初始超参组合之间的函数关系进行修正。可选的,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来包括:对于贝叶斯优化算法的任一轮迭代,超参组合中至少包括LightGBM模型迭代的次数,其中,对于LightGBM模型,每一次迭代均生成一个弱分类器,直到生成的弱分类器的个数与LightGBM模型迭代的次数相等;计算LightGBM模型每一次迭代生成的弱分类器的权重值,最终根据生成的每一个弱分类器及其对应的权重值,复合生成LightGBM模型,其中,复合生成的LightGBM模型为贝叶斯优化算法对应的所述任一轮迭代对应生成的模型。可选的,所述对于LightGBM模型,每一次迭代均生成一个弱分类器包括:沿着上一轮迭代生成的弱分类器的残差梯度下降的方向,生成下一轮迭代对应的弱分类器。可选的,所述计算LightGBM模型每一次迭代生成的弱分类器的权重值包括:对于LightGBM模型每一次迭代生成的弱分类器,选择测试集输入所述弱分类器中,由所述弱分类器输出测试结果;根据所述弱分类器输出的测试结果和实际结果,计算所述弱分类器的正确率;根据所述正确率确定所述弱分类器的权重值。可选的,通过如下公式确定所述弱分类器的权重值:其中,acuracy为弱分类器的测试结果中的正确样本数,total为测试集的总体样本数,α为超参组合中的平衡系数,在超参组合中预置。根据本专利技术实施例第二方面提供一种电力数据网流量异常检测系统,包括:输入模块,用于将采集的电力数据网的流量特征数据输入LightGBM模型中,使得所述LightGBM模型输出所述电力数据网的流量特征数据对应的正常或异常结果;其中,所述LightGBM模型为根据电力数据网的训练集训练而来,所述训练集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;其中,利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来。根据本专利技术实施例的第三个方面,还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器调用所述程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的电力数据网流量异常检测方法。根据本专利技术实施例的第四个方面,还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的电力数据网流量异常检测方法。本专利技术实施例提供一种电力数据网流量异常检测方法、系统及电子设备,该方法将贝叶斯优化算法与LightGBM模型融合,利用贝叶斯优化算法确定LightGBM模型的最佳超参组合,对于LightGBM模型中的多个弱分类器进行权重的分配,提高Ligh本文档来自技高网
...

【技术保护点】
1.一种电力数据网流量异常检测方法,其特征在于,包括:/n将采集的电力数据网的流量特征数据输入LightGBM模型中,由所述LightGBM模型输出所述电力数据网的流量特征数据对应的正常或异常结果;/n其中,所述LightGBM模型为根据电力数据网的训练集训练而来,所述训练集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;/n其中,利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来。/n

【技术特征摘要】
1.一种电力数据网流量异常检测方法,其特征在于,包括:
将采集的电力数据网的流量特征数据输入LightGBM模型中,由所述LightGBM模型输出所述电力数据网的流量特征数据对应的正常或异常结果;
其中,所述LightGBM模型为根据电力数据网的训练集训练而来,所述训练集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;
其中,利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来。


2.根据权利要求1所述的电力数据网流量异常检测方法,其特征在于,所述利用贝叶斯优化算法确定所述LightGBM模型的最佳超参组合包括:
设置LightGBM模型的初始超参组合,按照所述初始超参组合,将测试集输入所述LightGBM模型中,由LightGBM模型输出测试结果,所述测试集中包括流量特征数据集合和每一个流量特征数据对应的标签,所述标签为流量正常或流量异常;
计算所述测试结果与实际结果之间的损失;
根据所述损失确定下一轮迭代LightGBM模型的超参组合;
重复迭代过程,直到计算出来的损失在预设损失阈值范围之内或者迭代次数达到上限,得到LightGBM模型的最佳超参组合。


3.根据权利要求2所述的电力数据网流量异常检测方法,其特征在于,所述根据所述损失确定下一轮迭代LightGBM模型的超参组合包括:
根据所述初始超参组合和对应的损失,建立损失与初始超参组合之间的函数关系;
根据损失与初始超参组合之间的函数关系,利用采集函数从所述初始超参组合中确定下一轮LightGBM模型的超参组合。


4.根据权利要求3所述的电力数据网流量异常检测方法,其特征在于,所述根据所述初始超参组合和对应的损失,计算损失与初始超参组合之间的函数关系还包括:
根据每一轮的超参组合及对应的损失,对建立的损失与初始超参组合之间的函数关系进行修正。


5.根据权利要求2所述的电力数据网流量异常检测方法,其特征在于,所述LightGBM模型由多个弱分类器以及每一个弱分类器对应的权重值复合而来包括:
对于贝叶斯优化算法的任一轮迭代,超参组合中至少包括LightGBM模型迭代的次数,其中,对...

【专利技术属性】
技术研发人员:叶萌周华旭黄观金鞠耀东邵志成龚卿张旭辉王苗庚陈尚权陈创波
申请(专利权)人:南方电网调峰调频发电有限公司信息通信分公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1