分布式场景下加密网络流量包特征提取方法技术

技术编号：35896529 阅读：16 留言：0更新日期：2022-12-10 10:30

本发明专利技术公开了一种分布式场景下的加密网络流量特征提取方法。该方法可以自动提取原始加密网络流量包中蕴含的特征信息，不需要手动进行特征信息的设计、选择和提取。该方法采用了一维卷积神经网络和注意力机制等技术，大幅度提升了所提取特征信息的代表能力。该方法适用于分布式场景，可以整合不同网络节点上收集的样本数据，提升模型训练精度，进而在分布式场景中的不同网络节点间，实现模型级别的样本数据共享，可以在一定程度上保障原始数据的安全。该方法可以作为子模块的形式，应用到新类型加密流量包的检测、现有类型加密流量包分类、新类型加密流量包类别标注等不同场景中。新类型加密流量包类别标注等不同场景中。新类型加密流量包类别标注等不同场景中。

全部详细技术资料下载

【技术实现步骤摘要】
特征提取模型f
θ
，以用于提取网络流量包的特征向量。
[0022]有益效果：
[0023]本专利技术所采用的方案，设计了一种分布式场景下的加密网络流量特征提取方法。该方案提供了一种端到端的加密网络流量特征提取模式，通过输入原始网络流量包，经过计算后，自动提取其中蕴含的特征信息，从而免除传统机器学习方案中需要手动进行特征信息的设计、选择和提取。该方案采用了一维卷积神经网络和注意力机制等技术，大幅度提升了所提取特征信息的代表能力。该方案提供了一种分布式场景下加密网络流量特征提取模型的训练方案。该训练方案可以整合不同网络节点上收集的样本数据，提升模型训练精度，进而在分布式场景中的不同网络节点间，实现模型级别的样本数据共享，可以在一定程度上保障原始数据的安全。本专利技术可以作为子模块的形式，应用到新类型加密流量包的检测、现有类型加密流量包分类、新类型加密流量包类别标注等许多不同的场景中。
附图说明
[0024]图1特征提取模型结构示意图
[0025]图2(a)新类型流量样本的特征向量top
‑
3元素的分布情况
[0026]图2(b)现有类型流量样本的特征向量top
‑
3元素的分布情况
[0027]图3高置信度新类型流量包样本提取模型
[0028]图4增量模型参数的类别表达能力
[0029]图5(a)网络流量包的二维空间视图(特征向量第1大和第2大元素维度)
[0030]图5(b)网络流量包的二维空间视图(特征向量第1...

【技术保护点】

【技术特征摘要】
1.一种分布式场景下加密网络流量包特征提取方法，其特征在于，包括以下步骤：(1)准备阶段：多个网络流量监测节点分别对各自负责的不同网络区域的网络流量进行监测；各个节点分别独立地收集了一定数量的已经进行类别标注(分配类别标签)的网络流量包样本(简称为“已标注样本”)；(2)特征提取模型的构建：网络流量包特征提取模型f
θ
可以表示成v＝f
θ
(x)，其中x为加密网络流量包，v是通过模型提取的特征向量；该特征提取模型f
θ
至少包括一个一维卷积(1D CNN)层和一个注意力(Attention)层；Attention层的输出经过变换后转化成一组权值；该组权值用作一维卷积层不同通道的权值，用于改变一维卷积层原有输出值；作为优化，该特征提取模型f
θ
还可以包括一维池化层、全连接层和激活层；(3)接口模型的构建：接口模型f
e
由softmax和argmax两个模块嵌套构成；该接口模型可以表示成y＝f
e
(v)＝argmax(softmax(v))；(4)优化方程的构建：优化方程可以表示成其中l是损失函数(loss function)；(5)模型的分布式训练：多个网络流量监测节点(简称为“节点”)，利用第(1)步所述的各自收集的已...

【专利技术属性】
技术研发人员：张平，唐艳艳，
申请(专利权)人：湖南工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人