基于多特征序列的匿名网络流量分类方法及系统技术方案

技术编号：37356840 阅读：33 留言：0更新日期：2023-04-27 07:06

本发明专利技术提供了一种基于多特征序列的匿名网络流量分类方法及系统，包括：步骤S1：采集网络流量文件，提取特征，进行数据归一化和流序列生成；步骤S2：对提取到的特征进行重要性排序，获取流量序列中最重要的连续性特征对应的特征序列，并转化为频域特征向量；步骤S3：通过频域特征提取网络将频域特征向量转化为中间特征向量，并将流序列其他特征通过其他特征提取网络转化为中间特征向量；步骤S4：拼接中间特征向量，通过分类网络后得到不同类别的概率分布。本发明专利技术能够抽出匿名通信流序列中重要的连续性特征，并挖掘其频域上的隐含信息，充分发挥Transformer框架对于连续的数据的序列特征捕获能力。征捕获能力。征捕获能力。

全部详细技术资料下载

【技术实现步骤摘要】
基于多特征序列的匿名网络流量分类方法及系统

[0001]本专利技术涉及网络安全、深度学习、匿名通信网络领域，具体地，涉及一种基于多特征序列的匿名网络流量分类方法及系统。

技术介绍

[0002]近年来，随着信息时代的发展，互联网所承载的服务越来越多，在互联网为人们带来便利的同时，也使得用户的各类隐私信息被收集，并在互联网中传输。以安全协议为代表的传统网络安全，主要侧重于对信息内容的保护，而对于同样重要的通信双方的身份信息却缺乏有效的保护。因此，在用户对于身份信息的保护需求日益增长的背景下，匿名通信技术应运而生。
[0003]匿名通信技术是一种通过采用数据转发、内容加密、流量混淆等措施来隐藏通信内容及关系的隐私保护技术，为了提高通信的匿名性，这些数据转发链路通常由多跳加密代理服务节点构成，所有服务节点共同构成了匿名通信网络。近年来，针对不同用户的需求，匿名通信技术已经发展出多种类型的匿名通信网络。例如洋葱路由(The Onion Router,Tor)，基于Tor改进的大蒜路由(Invisible Internet Project,I2P)本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多特征序列的匿名网络流量分类方法，其特征在于，包括：步骤S1：采集网络流量文件，提取特征，进行数据归一化和流序列生成；步骤S2：对提取到的特征进行重要性排序，获取流量序列中最重要的连续性特征对应的特征序列，并转化为频域特征向量；步骤S3：通过频域特征提取网络将频域特征向量转化为中间特征向量，并将流序列其他特征通过其他特征提取网络转化为中间特征向量；步骤S4：拼接中间特征向量，通过分类网络后得到不同类别的概率分布。2.根据权利要求1所述的基于多特征序列的匿名网络流量分类方法，其特征在于，在所述步骤S1中：步骤S1.1：捕获流经设备的匿名网络流量数据包，捕获的数据包格式为pcap；步骤S1.2：对采集到的数据集以预设时间跨度进行切割；步骤S1.3：对所采集到并切割好的pcap文件进行特征提取，输出数据包的流特征值；步骤S1.4：使用归一化算法将数据统一映射到[0,1]区间，归一化算法公式为：其中，μ为原始数据均值，σ为标准差，x为原始数据值，z为归一化后的新数据值；步骤S1.5：选择Z个连续的流数据为一个块进行处理。3.根据权利要求1所述的基于多特征序列的匿名网络流量分类方法，其特征在于，在所述步骤S2中：步骤S2.1：对提取出的所有特征进行特征筛选，去除特征包括每个流数据的初始时间戳、最终时间戳、IP和TCP参数，保留预设个特征；步骤S2.2：对筛选出的特征使用随机森林算法或主成分分析法计算每个特征的重要性，并根据重要性对特征进行排序；选择最重要的预设个特征；步骤S2.3：对选择的特征，分别记为特征d,e，对Z个连续的流数据，分别构建Z维的特征向量，构建长度为Z的特征序列{d[n]}
0≤n＜N
与{e[n]}
0≤n＜N
，此处N＝Z；将特征序列转化为频域特征向量，计算公式为：将变换结果组合为频域特征向量及将频域特征向量分别作为Transformer框架的编码器的输入，输出2个1
×
n的特征向量，通过MLP映射为2个1
×
h的特征向量，其中h为自定义参数，拼接为1
×
2h的中间特征向量a。4.根据权利要求1所述的基于多特征序列的匿名网络流量分类方法，其特征在于，在所述步骤S3中：对于未选择的其他特征，选择重要性位于前预设个的特征，对于所述的Z个连续的流数据，构建Z个1
×
20的向量，通过DNN映射为Z个1
×
h的向量，拼接后输入均值或最值池化层，得到1
×
h的中间特征向量b。5.根据权利要求1所述的基于多特征序列的匿名网络流量分类方法，其特征在于，在所述步骤S4中：
对于输出的中...

【专利技术属性】
技术研发人员：黄浩铭，王轶骏，薛质，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人