【技术实现步骤摘要】
一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法
[0001]本专利技术属于电力安全预警数据的处理分析领域,一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法
技术介绍
[0002]随着互联网技术和基础设施的快速发展,电力网络系统也进入了大数据、大流量的时代,既给电力系统带来更便利的管理与控制时,随之而来的,电力网络防护系统每天都会收到海量的网络攻击与威胁数据,并且还在以指数级形式增长。传统的电力入侵检测系统面对海量的安全数据时,存在报警信息冗余泛滥、系统漏报误报率高的问题。
技术实现思路
[0003]为了解决上述
技术介绍
中存在的问题,本申请提出一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法,目的在于解决电力入侵检测系统面对海量的安全数据时,报警信息冗余泛滥、系统漏报误报率高的问题。
[0004]本专利技术所采用的技术方案如下:
[0005]一种基于改进K
‑
means算法的电力安 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法,其特征在于,包括如下步骤:步骤1、采集电网入侵检测系统中初始安全数据;步骤2、对采集到的安全数据进行预处理,得到安全数据集;步骤3、运用改进后的基于密度与距离的K
‑
means算法对的安全数据集中的数据进行聚类分析,得到最终的报警数据聚类结果。2.根据权利要求1所述的一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法,其特征在于,所述改进后的基于密度与距离的K
‑
means算法进行聚类分析的方法如下:步骤3.1、将经过预处理后的安全数据集的样本作为输入,计算样本点不同维度数据的权值;基于样本点同维度数据的权值计算样本点之间加权的欧式距离;再根据样本点之间加权的欧式距离计算出所有样本点的平均距离avgd;步骤3.2、以任意样本点为中心,R=avgd为半径画圆,将圆内的所有样本点数目作为样本点的密度;步骤3.3、根据样本点的密度选取聚类中心;步骤3.4、由得到的初始聚类中心和聚类数为输入,对给定数据集进行聚类运算,直到聚类中心不再变化;步骤3.5、输出最终聚类结果,完成对安全数据的聚类处理。3.根据权利要求2所述的一种基于改进K
‑
means算法的电力安全预警数据聚类处理方法,其特征在于,步骤3.3中选取聚类中心的方法为:按样本点的密度从大到小的顺序将前个样本数据存入到数据集合U中,选取样本点密度最大的点x1作为第一个聚类中心放入中心点集合C中,然后将U中所有距离点x1小于avgd的点删除;在数据集合U中找出权值参数最大的点作为第2个中心点x2加入到中心点集合C中,将U中所有距离点x2小于avgd的点删除;重复上述过程,直到数据集U变为空集,此时C={C1,C2,...,k...
【专利技术属性】
技术研发人员:王新龙,于铭岱,毕馨月,张晨锐,杨云兮,杜昭辉,
申请(专利权)人:南京工程学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。