一种基于形状的抗噪加密流量聚类方法技术

技术编号:45094750 阅读:38 留言:0更新日期:2025-04-25 18:32
本发明专利技术公开了一种基于形状的抗噪加密流量聚类方法。本方法步骤为:1)获取并解析原始流量数据,得到多条数据流;按设定时间间隔对每一条数据流的上行数据和下行数据进行划分,得到每一条数据流对应的上行序列U和下行序列D;2)将每一条流的上行序列U和下行序列D拼接形成一个整体序列F,代表对应数据流的行为特征;从数据流的行为特征中提取对应数据流的形状线S和统计特征;3)基于各数据流归一化后的形状线S对各数据流进行聚类,将具有相同行为模式的数据流聚为一簇;4)基于统计特征计算每个簇的聚类中心特征;然后计算未聚类到任意簇中的数据流的统计特征与各聚类中心特征之间的欧氏距离,确定对应数据流的类别或是否为异常点。

【技术实现步骤摘要】

本专利技术属于网络通信,特别是加密流量分析和流量分类,涉及一种基于形状的抗噪加密流量聚类方法


技术介绍

1、网络流量分类技术是网络通信领域中的基础技术,传统方法主要依赖端口分析和深度包检测(dpi),但这些技术在面对加密流量时效果受限,因为加密数据包的内容无法直接读取。随着加密技术如ssl/tls的普及,研究者转向基于机器学习和深度学习的方法,这些方法通过分析流量的统计特征而非直接内容来实现分类,从而在处理加密流量方面显示出优势。然而,这些方法通常需要大量标记数据进行模型训练,这在实际应用中存在挑战。本申请提案提出的基于形状的抗噪加密流量聚类方法,旨在解决现有技术中对大量标记数据的依赖问题,通过无监督学习实现对加密流量的高效分类。

2、深度学习技术是机器学习的一个分支,它通过使用多层神经网络来模拟人脑处理信息的方式。在网络流量分类领域,深度学习方法被用来自动提取流量特征,并进行分类。深度学习模型能够处理高维数据,并且能够学习到数据中的复杂模式,这对于加密流量的分类尤其有用。但是,深度学习模型的训练通常需要大量的标记数据,并且计算资源消耗较大。本文档来自技高网...

【技术保护点】

1.一种基于形状的抗噪加密流量聚类方法,其步骤包括:

2.根据权利要求1所述的方法,其特征在于,从每一数据流的行为特征中提取对应数据流的形状线S的方法为:使用带有滑动窗口的移动平均算法对整体序列F=(f1,f2,…,fq)进行平滑;其中,若上行序列U的零值比例大于50%,则滑动窗口大小否则滑动窗口大小对于整体序列F中的每个点ft,其对应的形状线S上的点st是向量(ft-w+1,…,ft)的均值,形状线S=(sw,sw+1,…,sq),

3.根据权利要求1所述的方法,其特征在于,所述统计特征包括下行序列D的平均值、上行序列U均值与下行序列D均值的比值、上行序列U中零...

【技术特征摘要】

1.一种基于形状的抗噪加密流量聚类方法,其步骤包括:

2.根据权利要求1所述的方法,其特征在于,从每一数据流的行为特征中提取对应数据流的形状线s的方法为:使用带有滑动窗口的移动平均算法对整体序列f=(f1,f2,…,fq)进行平滑;其中,若上行序列u的零值比例大于50%,则滑动窗口大小否则滑动窗口大小对于整体序列f中的每个点ft,其对应的形状线s上的点st是向量(ft-w+1,…,ft)的均值,形状线s=(sw,sw+1,…,sq),

3.根据权利要求1所述的方法,其特征在于,所述统计特征包括下行序列d的平均值、上行序列u均值与下行序列d均值的比值、上行序列u中零值的比例以及整体序列f的总长度。

4.根据权利要求1或2或3所述的方法,其特征在于,基于各数据流对应的归一化后的形状线s对各数据流进行聚类的方法为:

5.根据权利要求4所述的方法,其特征在于,其中,s∈[1-m,n-1]。

...

【专利技术属性】
技术研发人员:杜梅婕胡明祺李舒李钊张中一张宏飞刘庆云
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1