一种基于期望优化的网络流量隐私保护方法技术

技术编号：40540047 阅读：4 留言：0更新日期：2024-03-05 18:55

本发明专利技术属于网络安全和深度学习领域，公开了一种基于期望优化的网络流量隐私保护方法，本发明专利技术在网络流量的弱相关区域叠加针对性的、可变换的对抗数据补丁，使用期望优化提高指定目标类别的预期概率，通过梯度下降法使得数据补丁特征比流量图像的原始类别特征更加显著，在保证对抗流量完整性以及可执行性的同时，误导恶意流量分类模型输出高置信度的错误分类，以保护网络通信免受流量分析攻击。本发明专利技术结合网络流量的数字性、与图像相比较差的可读性和流量图像的肉眼难分辨性，生成干扰性极强的扰动，并将其放置在网络流量弱相关的数据位，在降低存在度的同时提高干扰性，从而做到自主的流量隐私保护，具有广阔的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于网络安全和深度学习领域，具体是一种基于期望优化的网络流量隐私保护方法。

技术介绍

1、网络流量分类技术是一种常见的网络管理手段，其可以帮助管理者更好对网络进行有效监督管理，但是，基于深度学习的网络流量分类技术在增强网络可控性的同时给用户流量隐私也带来了风险与挑战。攻击者即网络监控者使用流量分类以对目标网络流量进行监控、拦截、分类等，帮助实施进一步攻击。随着大众网络安全意识的稳步提升，网络用户对于流量隐私数据保护的意识也愈加强烈，流量隐私保护成为保护个人隐私和确保网络安全的迫切需求。对于流量分析攻击，研究人员提出了各类防御机制。较为典型的防御方法是伪装流量特征，其中，数据填充和空数据包是最常用的包长度以及间隔时间的方法。例如，使用不同策略来填充数据包长度，对数据流的统计特征，如数据包的长度、比特频率等进行流量变形，通过控制发送时间来掩盖真实的时间和长度信息，使用不同的真实流量作为访问网站时的噪音等，还有研究将浏览器由全双工模式变成了半双工模式，从而以较小的代价换来防御水平的提升，提出服务端防御以及运行在应用层的轻量级的客户端防御技术等等。然而，这些措施大多数的效果不尽人意，并且有可能提高了额外的性能代价。在生成对抗流量方面，有研究者使用较早期的对抗样本生成算法如c&w、fgsm等生成对抗流量图像，虽然干扰性得到验证，但是，由于不同流量图像产生的对抗扰动的数据值、位置、大小的不确定性，当对抗图像再次还原为流量后，在某些敏感数据位添加的扰动可能会直接导致该网络流量样本不可用，流量的完整性以及可执行性被破坏，无法继

技术实现思路

1、为了解决现有的流量分析防御机制动态性低、成本高、难符合网络通讯实际等问题，本专利技术提供的一种基于期望优化的网络流量隐私保护方法，考虑网络监控者使用流量分析攻击对特定的流量模式进行监控和拦截的真实场景，本方法在网络流量的弱相关区域叠加针对性的、可变换的对抗数据补丁，使用期望优化提高指定目标类别的预期概率，通过梯度下降法使得数据补丁特征比流量图像的原始类别特征更加显著，在保证对抗流量完整性以及可执行性的同时，误导恶意流量分类模型输出高置信度的错误分类，以保护网络通信免受流量分析攻击，本专利技术模拟了网络监控者的两类分类方法，分别为直接进行流量数据分类和将流量可视化为图片后进行分类。

2、为了达到上述目的，本专利技术是通过以下技术方案实现的：

3、本专利技术是一种基于期望优化的网络流量隐私保护方法，该网络流量隐私保护方法包括以下步骤：

4、步骤1、数据预处理：采集网络流量，使用weka软件套件进行初步网络流量分析和特征选择，生成流量特征集，将网络流量所属应用分类值作为标签值，生成标签集，将流量特征整形为一维数列，对提取的流量特征一维数列进行数据处理与填充，生成带标签的流量特征数据集；

5、步骤2、将步骤1生成带标签的流量特征数据集中的单条流量数据特征整形为m*n的二维矩阵，将处理后的二维矩阵元素值映射为像素灰度值，转化为灰度流量图像，结合读取步骤1中标签集的数据，可视化为带该标签的流量图像数据集；

6、步骤3、模拟网络监控者直接使用流量分类模型对步骤1中流量数据集进行训练及分类测试，计算分类准确率；模拟网络监控者将流量可视化后进行分类，使用图像分类模型对步骤2中的所述流量图像数据集进行训练及测试，得到流量图像训练集，计算流量图像分类准确率；

7、步骤4、制作掩模，定位所述流量图像数据集中的弱相关区域，考虑数据补丁的变换，使用期望优化在流量图像训练集的补丁图像以及补丁变换和位置的分布上，计算目标类别的预期概率并优化，通过梯度下降法迭代生成最优对抗数据补丁；

8、步骤5、将对抗数据补丁叠加在流量图像数据集中的弱相关区域，生成对抗流量图像集，对抗流量图像集由图像灰度值映射为流量数据，生成对抗流量数据集；

9、步骤6、模拟网络监控者使用图像分类模型对对抗流量图像集进行训练及测试，计算目标类别补丁干扰率，以干扰率评估对抗数据补丁在流量可视化后分类上的分类干扰效果；模拟网络监控者使用流量分类模型对对抗流量数据集进行训练及测试，计算目标类别补丁干扰率，以干扰率评估对抗数据补丁在直接流量分类上的分类干扰效果。

10、本专利技术的进一步改进在于：在所述步骤1中，所述特征选择具体为：使用高斯核进行密度估计，使用快速相关性基础过滤器(fcbf)方法计算特征与类别之间的相关性以及特征之间的相关性，去除无关或冗余的特征，进行特征选择。

11、本专利技术的进一步改进在于：所述步骤3和步骤6中的流量分类模型为weka朴素贝叶斯分类器，使用weka朴素贝叶斯分类器计算流量数据集分类的准确率和补丁干扰率。

12、本专利技术的进一步改进在于：所述步骤3和所述步骤6中的图像分类模型是改进的resnet模型，使用改进的resnet模型测试m*n大小的流量图像分类准确率和补丁干扰率，该模型第一层为输入层，接收m*n的图像，第二层为卷积层，使用一组可学习的滤波器提取图像的局部特征，第三层批量归一化层，跟随在每个卷积层后面，使用relu激活函数，第四层为残差块，包含两个卷积层以及一个跳跃连接，防止梯度消失，第五层为全局平均池化层，对图像进行平均操作并输出数值，第六层为全连接层，有k个输出节点，将全局平均池化层的输出转换为预测类别，对应于k类标签值，处理完成的流量图像数据集以1:1的比例随机划分成训练集和测试集。

13、本专利技术的进一步改进在于：所述步骤4中，选择流量特征值中由相关性较低的特征所在的数据字段为弱相关位，将连续的一段弱相关位定义为网络流量特征中的弱相关区域，网络流量中的弱相关区域被映射为流量图像中的一块连续矩形区域或跨行连续区域，当遇到弱相关区域跨行且并形状不规则时，截取其中最大的矩形位。

14、本专利技术的进一步改进在于：所述步骤4具体包括以下步骤：

15、步骤4.1、规范数据补丁的初始化形状为矩形，根据弱相关区域的大小初始化补丁大小，规定数据补丁的图像通道数为1；

16、步骤4.2、根据弱相关区域的大小规定噪声百分比，并生成随机的初始化数据补丁，噪声百分比表示数据补丁在图像中所占的比例；

17、步骤4.3、生成与流量图像大小一致的全0数组，将生成的初始化数据补丁应用在该数组的弱相关区域上，用于存储叠加了数据补丁的图像；

18、步骤4.4、创建一个叠加了数据补丁的数组副本，将副本中所有非零元素设置为1，生成掩模，掩模中的元素只有0和1，其中，值为1的位置对应于数据补丁在流量图像上的位置；

19、步骤4.5、制作掩模用于标识出流量图像中数据补丁所在的位置，以便将数据补丁应用到灰度流量图像上，掩模中，定义本文档来自技高网...

【技术保护点】

1.一种基于期望优化的网络流量隐私保护方法，其特征在于：所述网络流量隐私保护方法包括以下步骤：

2.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：在所述步骤1中，所述特征选择具体为：使用高斯核进行密度估计，使用快速相关性基础过滤器(FCBF)方法计算特征与类别之间的相关性以及特征之间的相关性，去除无关或冗余的特征，进行特征选择。

3.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤3和步骤6中的流量分类模型为weka朴素贝叶斯分类器，使用weka朴素贝叶斯分类器计算流量数据集分类的准确率和补丁干扰率。

4.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤3和所述步骤6中的图像分类模型是改进的ResNet模型，使用改进的ResNet模型测试m*n大小的流量图像分类准确率和补丁干扰率，该模型第一层为输入层，接收m*n的图像，第二层为卷积层，使用一组可学习的滤波器提取图像的局部特征，第三层为批量归一化层，跟随在每个卷积层后面，使用ReLU激活函数，第四层为残差块

5.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤4中，选择流量特征值中相关性较低的特征所在的数据字段为弱相关位，将连续的一段弱相关位定义为网络流量中的弱相关区域，网络流量中的弱相关区域被映射为流量图像中的一块连续矩形区域或跨行连续区域，当遇到弱相关区域跨行且并形状不规则时，截取其中最大的矩形位。

6.根据权利要求5所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤4具体包括以下步骤：

7.根据权利要求6所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：在所述步骤4.8中，期望优化公式：

8.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤6中分类干扰效果的评价指标为分类准确率，包括：单种类分类准确率SCAi、总体分类准确率GCA和目标类别补丁干扰率TIRi，表示如下：

9.根据权利要求1-8任一项所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述网络流程隐私保护方法通过自动化流量伪装系统实现，所述自动化流量伪装系统包括一个流量可视化转换器、一个对抗数据补丁生成器和一个流量生成器，所述流量可视化转换器对客户端流量进行特征提取及预处理后映射为灰度图像，所述对抗数据补丁生成器自动定位流量图像中弱相关区域并使用梯度下降法迭代最优对抗数据补丁，所述流量生成器将补丁叠加在流量图弱相关区域生成对抗流量图像，同时将其逆转为对抗流量。

...

【技术特征摘要】

1.一种基于期望优化的网络流量隐私保护方法，其特征在于：所述网络流量隐私保护方法包括以下步骤：

2.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：在所述步骤1中，所述特征选择具体为：使用高斯核进行密度估计，使用快速相关性基础过滤器(fcbf)方法计算特征与类别之间的相关性以及特征之间的相关性，去除无关或冗余的特征，进行特征选择。

4.根据权利要求1所述的一种基于期望优化的网络流量隐私保护方法，其特征在于：所述步骤3和所述步骤6中的图像分类模型是改进的resnet模型，使用改进的resnet模型测试m*n大小的流量图像分类准确率和补丁干扰率，该模型第一层为输入层，接收m*n的图像，第二层为卷积层，使用一组可学习的滤波器提取图像的局部特征，第三层为批量归一化层，跟随在每个卷积层后面，使用relu激活函数，第四层为残差块，包含两个卷积层以及一个跳跃连接，防止梯度消失，第五层为全局平均池化层，对图像进行平均操作并输出数值，第六层为全连接层，有k个输出节点，将全局平均池化层的输出转换为预测类别，对应于k类标签值，处理完成的流量图像数据集以1:1的比例随机划分成训练集和测试集。

5.根据权利...

【专利技术属性】
技术研发人员：张雨娜，陈伟，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人