【技术实现步骤摘要】
一种基于无监督双层聚类的网络攻击行为识别方法和装置
[0001]本专利技术涉及电信
,特别涉及一种基于无监督双层聚类的网络攻击行为识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]互联网的快速发展为各类社会生产活动提供了高效便捷的信息交流平台,推动着经济效益的不断提升。但同时由于海量的数据信息都依赖于互联网通道进行传播,特别是涉及大众隐私及相关单位保密数据的内容,也易于被不法分子通过互联网手段进行探知获取。因此掌握针对恶意网络攻击行为的检测手段,对互联网安全具有重要意义。
[0003]相关技术中,对于互联网攻击行为的检测依靠单层聚类算法对网络流量数据进行分析计算,通过比对各聚类蔟核心点中出现的异常行为来识别具有攻击行为的数据。
[0004]但现有技术方案里,在数据处理过程中没有考虑到影响后期聚类算法结果的数值范围溢出问题,导致检测结果的准确性低,网络攻击检测方法不够完善。
技术实现思路
[0005]本专利技术实施例提供一种基于无监督双层聚类的网络攻击行为识别方法、装置 ...
【技术保护点】
【技术特征摘要】
1.一种网络攻击行为识别方法,其特征在于,所述方法包括:从网络流量数据中,获取用于进行分析的预处理数据;通过双层聚类算法对所述预处理数据进行自适应聚类处理,获得聚类处理结果,所述聚类处理结果包括多个聚类簇;选取所述聚类簇的中心点数据,与用于表征正常网络行为的样本数据进行距离计算,获得计算结果;在所述计算结果满足预设条件的情况下,确定当前网络流量数据存在攻击行为。2.根据权利要求1所述的方法,其特征在于,所述从网络流量数据中,获取用于进行分析的预处理数据,包括:从所述网络流量数据中获取实时行为流量数据作为分析样本数据;将所述分析样本数据中数据的数值按比例统一至固定区间范围内,完成数据归一化处理并获得归一化处理结果;通过主成分分析算法对所述归一化处理结果进行降维处理,获得降维处理结果;将所述降为处理结果作为所述预处理数据。3.根据权利要求2所述的方法,其特征在于,所述将所述分析样本数据中的数值按比例统一至固定区间范围内,完成数据归一化处理并获得归一化处理结果,包括:获取所述分析样本数据中的最大样本值与最小样本值;获取所述分析样本数据与所述最小样本值的第一差值,以及所述最大样本值与所述最小样本值的第二差值;将所述第一差值与所述第二差值的比值作为针对当前分析样本数据的归一化处理结果。4.根据权利要求2所述的方法,其特征在于,所述通过主成分分析算法对所述归一化处理结果进行降维处理,获得降维处理结果,包括:将所述归一化处理结果中的数据按列组成初等矩阵;将所述初等矩阵中的每一行数据进行零均值化处理,并根据处理结果确定协方差矩阵以及与所述协方差矩阵对应的特征值和特征向量;根据所述特征向量与所述特征值的对应关系,按照特征值的大小关系将所述特征向量进行排列,获得特征向量矩阵;获取所述特征向量矩阵中的至少一行元素组成原始坐标矩阵;将所述原始坐标矩阵与经过零均值化处理后的初等矩阵的乘积,作为所述降维处理结果。5.根据权利要求1所述的方法,其特征在于,所述通过双层聚类算法对所述预处理数据进行自适应聚类处理,获得聚类处理结果,包括:通过近邻传...
【专利技术属性】
技术研发人员:李易聪,王丽芳,张国峰,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。