一种基于最大频繁模式非相似性的异常网络流量检测方法技术

技术编号：33734065 阅读：22 留言：0更新日期：2022-06-08 21:30

本发明专利技术提供了一种基于最大频繁模式非相似性的异常网络流量检测方法。包括：步骤1，利用模式增长法挖掘网络流量中的最大频繁模式，有效发现网络流量中属性的关联关系；步骤2，利用挖掘得到的具有强关联关系的网络流量的属性，构建基于最大频繁模式的非相似性指数，用于衡量各条网络流量的异常程度；步骤3，根据步骤2所构建的最大频繁模式的非相似性指数，计算每条网络流量的异常程度；步骤4，将网络流量按照异常度的降序顺序排列，得到异常网络流量检测报告。检测报告。检测报告。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于最大频繁模式非相似性的异常网络流量检测方法

[0001]本专利技术属于异常网络流量检测领域，涉及一种基于最大频繁模式非相似性的异常网络流量检测方法。

技术介绍

[0002]随着互联网技术的快速发展，网络流量的规模呈现出爆发式增长的趋势，如何对采集到的网络流量进行准确分类引起了学术界的广泛关注，也是一个亟待解决的关键问题。对网络流量进行准确分类的前提是所收集的网络流量数据集是安全可靠的，即所收集的网络流量数据集不包含任何异常的流量数据。因此，在进行网络流量分类操作之前，对网络流量数据进行异常检测以消除异常流量是非常必要的。另一方面，对网络流量数据的日益重视也使得人们对网络流量的安全问题更加关注，因此，如何使采集到的网络流量数据更加安全也成为研究热点。
[0003]与普通数据相比，网络流量数据是由多个具有不同属性的数据元素组成，而不同属性的数据元素通常具有一定的关联性，这就需要对网络流量数据中的属性进行关联分析。同样，在对网络流量数据进行异常检测的过程中，也需要充分考虑网络流量数据属性之间的关联，才能更准确地检测出隐藏在网络流量数据中的异常流量。作为保证网络流量数据安全的重要方法，异常检测是这些年的研究热点，它被广泛应用于信用卡欺诈检测、网络入侵检测、社交网络检测、轨迹检测等领域。
[0004]近年来，学者们提出了大量的异常检测方法，包括：基于聚类的方法、基于距离的方法、基于密度的方法、基于模型的方法、基于分布的方法、基于深度学习的方法以及基于关联关系的方法。在这些异常检测方法中，大多数只考虑数据...

【技术保护点】

【技术特征摘要】
1.一种基于最大频繁模式非相似性的异常网络流量检测方法，其特征在于，包括如下步骤：步骤1，利用模式增长法挖掘网络流量中的最大频繁模式，有效发现网络流量中属性的关联关系；步骤2，利用挖掘得到的具有强关联关系的网络流量的属性，构建基于最大频繁模式的非相似性指数，用于衡量各条网络流量的异常程度；步骤3，根据步骤2所构建的最大频繁模式的非相似性指数，计算每条网络流量的异常程度；步骤4，将网络流量按照异常度的降序顺序排列，得到异常网络流量检测报告。2.如权利要求1所述方法，其特征在于，所述步骤1的具体实现包括如下步骤：步骤2.1，扫描网络流量，计算网络流量中每个属性的支持度，从而删除支持度小于最小支持度阈值的非频繁属性，并将频繁的属性按照其支持度降序的顺序进行排列；步骤2.2，将网络流量中所有长度为1的频繁的属性，即频繁1
‑
模式，按照步骤2.1排列好的顺序依次插入一课以NULL为根节点的频繁模式树中，频繁模式树简称为：FP
‑
Tree；步骤2.3，从FP
‑
Tree中依次取出支持度等于设定的最小支持度阈值的频繁1
‑
模式，将其按照模式增长法分别与其它的频繁1
‑
模式进行“模式扩展”，即扩展的过程从2
‑
模式至更长的模式，通过计算所扩展得到的模式的支持度并将其支持度与最小支持度阈值进行比较，以挖掘最大频繁模式；步骤2.4，从FP
‑
Tree中取出支持度大于最小支持度阈值的频繁1
‑
模式，将其按照FP
‑
Tree结构进行模式的遍历以将其首先扩展为k
‑
模式,k为可扩展模式的最长长度；步骤2.5，计算由步骤2.4扩展得到的k
‑
模式的支持度，若k
‑
模式的支持度不小于...

【专利技术属性】
技术研发人员：蔡赛华，陈锦富，徐波，魏忠旺，林敏，
申请(专利权)人：江苏省未来网络创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人