一种基于辅助分类式生成对抗网络的网络攻击流量生成方法技术

技术编号：29402180 阅读：14 留言：0更新日期：2021-07-23 22:39

本发明专利技术公开设计了一种基于辅助分类式生成对抗网络的网络攻击流量生成方法，该方法利用生成式对抗网络的原理能够实现根据已有的网络攻击流量数据集样本，来生成能够欺骗和逃避防御系统检测的恶意流量样本。本发明专利技术包括：多源异构数据融合处理模块，负责定义一种统一的数据格式；生成器网络，负责根据高斯噪声和来自判别器的反馈来生成网络统计流量样本；判别器网络，负责对生成器生成的攻击流量样本和原始网络流量样本进行分析，包括真伪分析和攻击流量类别分析；分类微调模块，负责调试生成模型生成特定类型流量样本的性能。本发明专利技术通过构造基于辅助分类式生成对抗网络的网络攻击流量生成模型，在生成网络流量时能够根据网络攻击的类型来生成特定类型的网络攻击流量样本，通过生成此类对抗样本可以模拟网络攻击来检测现有入侵检测系统的鲁棒性，为现有的流量生成器提供了新思路。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于辅助分类式生成对抗网络的网络攻击流量生成方法
本专利技术涉及网络安全和工业互联网网络仿真领域，具体设计了一种基于辅助分类式生成对抗网络的网络攻击流量生成方法。
技术介绍
随着对工业互联网架构研究与应用的不断深入，与实际情况相符的流量模型在新的网络架构的性能评估中的关键作用变得越来越明显，建设复杂的多行业工业互联网流量特性的安全测试流量模拟器势在必行。由于工业互联网应用场景复杂、专用协议众多、流量数据规模巨大，为了保障工业互联网设备、控制、网络、平台、数据安全，需加强针对工业互联网的安全测试工作。工业互联网网络数据流量测试是工业互联网安全测试重要手段之一。工业互联网行业场景、网络协议的特殊性对目前的流量仿真工具提出了严峻的挑战。传统的网络仿真工具(如Cloudsim、OPNET等)流量建模方式专注于特定应用的流量模型与简化的流量混合，不能按照不同工业行业应用场景的需要给用户提供更多关于虚拟设备数据产生参数和网络参数配置。而且一般只支持建模仿真数量有限的虚拟设备和特定的网络环境，对复杂的工业应用场景的仿真表现有待提高。同时，这些仿真工具在实际仿真过程中消耗的时间过长，一个简单应用场景的仿真由于没有仿真时间压缩机制可能需要非常久的时间，仿真效率明显不足。随着对抗生成网络的兴起和发展，GAN被应用于多种领域，包括语音生成、图像生成、文本生成等等。但在许多实际场景中，有标注数据其实只占少数，而大量无标签数据更容易获取。因此，衍生出半监督学习，以同时利用少量标签数据与大量无标签数据进行协同训练，从而实现对...

【技术保护点】
1.一种基于辅助分类式生成对抗网络的网络攻击流量生成方法，其特征在于，包括：/nA、多源异构网络流量融合：将不同的网络包格式如PCAP格式，NETFLOW格式，CFLOW格式，JFLOW格式及SFLOW格式的数据文件进行特征提取和统一的定义与标注来定义一种通用的数据格式，将统一格式后的数据用于生成模型的训练与数据的生成；/nB、网络攻击流量生成模型训练：定义辅助分类式生成对抗网络所需的流量生成器与流量判别器的网络结构以及辅助分类式生成对抗网络所需的生成损失函数与分类损失函数及训练方法；/nC、生成模型的分类微调：对上一步生成的网络攻击流量样本进行进一步的验证与微调，以此来调试生成模型生成特定攻击类型流量样本的性能。/n

【技术特征摘要】
1.一种基于辅助分类式生成对抗网络的网络攻击流量生成方法，其特征在于，包括：
A、多源异构网络流量融合：将不同的网络包格式如PCAP格式，NETFLOW格式，CFLOW格式，JFLOW格式及SFLOW格式的数据文件进行特征提取和统一的定义与标注来定义一种通用的数据格式，将统一格式后的数据用于生成模型的训练与数据的生成；
B、网络攻击流量生成模型训练：定义辅助分类式生成对抗网络所需的流量生成器与流量判别器的网络结构以及辅助分类式生成对抗网络所需的生成损失函数与分类损失函数及训练方法；
C、生成模型的分类微调：对上一步生成的网络攻击流量样本进行进一步的验证与微调，以此来调试生成模型生成特定攻击类型流量样本的性能。

2.根据权利要求1所述的一种基于辅助分类式生成对抗网络的网络攻击流量生成方法，其特征在于，步骤A进一步包括以下步骤：
A1、将不同格式的原始网络数据样本按照网络层协议的五元组(源IP地址，目的IP地址，源端口号，目的端口号，和传输层协议)切割成网络会话，即双向网络流数据；
A2、在网络数据生成和生成数据的使用过程中以太网包头部分不包含任何有效的信息，所以在数据生成之前，需要将上一步骤提取得到的网络会话删除掉会话中所有原始数据包的以太网部分的相关信息；
A3、网络会话信息主要存在于会话开始阶段的前十几个包的数据，在使用网络数据样本之前对网络会话的数据样本大小进行固定处理。即将上一步骤得到的网络会话数据样本的大小固定为1466字节，对于会话数据长度超过1466字节的部分进行截断处理，对于会话数据长度不足1466字节的会话进行零比特填充处理；
A4、由于在步骤A2将每个数据包的包头部分进行了删除处理，在使用上一步骤得到的数据前，还在会话数据的头部添加了14B的固定头部信息，包括4B源IP地址，4B目的IP地址，2B源端口号，2B目的端口号，和2B的会话长...

【专利技术属性】
技术研发人员：张茹，吕智帅，刘建毅，胡威，李静，曲延盛，王婵，
申请(专利权)人：北京邮电大学，国家电网有限公司信息通信分公司，国网山东省电力公司信息通信公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人