结合自编码器和WGAN的网络攻击流量数据增强方法及系统技术方案

技术编号:28140927 阅读:39 留言:0更新日期:2021-04-21 19:17
本发明专利技术公开一种结合自编码器和WGAN的网络攻击流量数据增强方法及系统,涉及网络空间安全领域、通信网络异常流量检测和人工智能领域,针对网络攻击流量检测模型学习、训练、优化的需要,结合自编码器和生成式对抗网络构建改进的生成对抗网络,利用生成对抗网络学习数据分布的特点,生成数据分布、特征更符合真实流量特点的网络攻击流量数据来辅助网络攻击检测。测。测。

【技术实现步骤摘要】
结合自编码器和WGAN的网络攻击流量数据增强方法及系统


[0001]本专利技术涉及网络空间安全领域、通信网络异常流量检测和人工智能领域,具体涉及一种结合自编码器和WGAN的网络攻击流量数据增强方法及系统。

技术介绍

[0002]互联网技术蓬勃发展给人们带来便利的同时也带了很多潜在的威胁。由于恶意软件具备监听、窃密、隐蔽能力,黑客在网络攻击中通常会使用它来控制用户主机、监控用户操作、提升自身权限、窃取敏感信息。恶意软件的存在对个人、企业、社会组织以及国家的网络空间都造成了严重的危害,如何检测网络恶意攻击、非法入侵、窃取机密等破坏网络安全的行为成为目前学术界和工业界研究的热点。除了检测方法上的提升和改进,输入端的数据集也会限制检测模型效果的提升。一方面,有标签数据集很少包含真实的用户行为和最新的攻击场景。因为数据集的构造和标注需要大量的时间精力和专家知识,但恶意程序为了躲避检测不断地更新改进自身,产生各类变体。因此,用旧的数据集训练的检测模型对目前现实的流量进行检测可能会导致检测准确率的降低。另一方面,在现实世界中,攻击流量只占正常流量中的很小一部本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种结合自编码器和WGAN的网络攻击流量数据增强方法,其特征在于,包括以下步骤:结合自编码器和生成式对抗网络,构建改进的生成对抗网络,该改进的生成对抗网络包括生成器、鉴别器和编码器;对改进的生成对抗网络进行训练,其中,鉴别器和编码器输入训练集数据,编码器生成与训练集数据分布特征相同的数据;生成器输入随机噪声,生成新数据;将编码器生成的数据与生成器生成的数据组成数据对,输入到鉴别器中来判断数据对中的两个数据各自由谁生成,通过迭代训练和判断,调整生成器和鉴别器的参数,直至鉴别器无法区分数据对中的数据时完成训练;基于网络攻击流量数据构建不平衡数据集,将不平衡数据集中需要增强的小类别数据进行特征数据筛选,将筛选出的特征数据处理成维度相同的二进制数据串;将二进制数据串输入到训练好的改进的生成对抗网络中进行数据增强;对增强后的二进制数据串进行逆向处理,恢复成可读的原始特征形态数据,将该数据加入到上述不平衡数据集中,实现网络攻击流量数据增强。2.如权利要求1所述的方法,其特征在于,对筛选出的特征数据进行处理的方法包括:对于类别型特征采取独热编码,对于连续型特征行归一化,对于离散型特征进行二值化处理。3.如权利要求1所述的方法,其特征在于,生成器、编码器、鉴别器均包含全连接层、Dropout层和批量正则化层。4.如权利要求1所述的方法,其特征在于,训练时调整生成器和鉴别器的参数的方法为:先固定鉴别器的参数,生成器生成数据,根据鉴别器的结果返回进行参数调整优化;再固定生成器的参数,将生成的数据输入到鉴别器,对鉴别器的参数进行调整优化。5.如权利要求1所述的方法,其特征在于,改进的生成对抗网络中的损失函数公式如下:其中,W表示损失...

【专利技术属性】
技术研发人员:姚叶鹏郝星然汪秋云贾梓健姜政伟刘宝旭
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1