网络流量特征序列生成模型的训练方法、生成方法及装置制造方法及图纸

技术编号:36025513 阅读:26 留言:0更新日期:2022-12-21 10:23
本发明专利技术提供一种网络流量特征序列生成模型的训练方法、生成方法及装置,针对网络流量的包含基础特征、数据包特征、时间特征和恶意流量特征的特征序列进行仿真,能够关注到应用层数据的特征。基于生成对抗网络进行无监督学习,简化了配置工作,提高了对网络流量特征序列进行仿真的效率。其中,基于强化学习构建生成器,能够提高对网络特征仿真的泛化能力,以适应更复杂的网络环境。采用蒙特卡洛学习构建生成器能够提高生成器的泛化能力。采用Wasserstein Loss作为生成器的损失函数,能够免生成对抗网络中常见的过拟合和模式崩溃问题。题。题。

【技术实现步骤摘要】
网络流量特征序列生成模型的训练方法、生成方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种网络流量特征序列生成模型的训练方法、生成方法及装置。

技术介绍

[0002]网络流量分析是提取、记录和分析网络流量通信模式的过程。高效的网络流量分析模型可以优化网络的整体表现,增强网络的安全性和提高网络资源的管理效率。然而网络流量数据的不足将严重的影响这些分析模型的表现。但是,根据用户隐私协议,网络流量数据通常是被严格监管的,意味着需要花费很长的时间来获取访问网络流量数据的权限。同时,数据量的大小是很有限的,通常不足以支持复杂的分析模型。所以,网络工程师一般很难获取足量的、高质量的和干净的网络流量数据。
[0003]为了解决数据不足的问题,网络工程师们常常通过生成新的符合真实网络环境的网络流量数据来增强已有数据。这些生成的流量不是来源于真实的网络环境,而是由人工合成的。现有的网络流量生成仿真器绝大多数都是基于概率模型。例如,仿真器Harpoon从现有的网络流量记录中提取网络流量分布的概率参数,再根据这些参数生成新的网络流量数据。<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种网络流量特征序列生成模型的训练方法,其特征在于,该方法包括以下步骤:获取指定多个网络设备的真实网络流量,并以数据包序列的形式记录为第一设定格式文件;采用预设工具提取各网络设备之间所述网络流量的特征序列并记录为第二设定格式文件,所述特征序列包括基础特征、数据包特征、时间特征和恶意流量特征;获取生成对抗网络初始模型,所述生成对抗网络初始模型包括生成器和判别器,所述生成器为单层门控那个循环单元,所述判别器为双层门控循环单元;以各网络设备之间仿真网络流量的特征序列作为状态空间,以要生成的所述仿真网络流量的特征序列作为动作空间,通过所述生成器建立所述状态空间到所述动作空间的映射更新动作空间,将所述动作空间添加至所述状态空间以更新状态空间,从所述判别器获取所述仿真网络流量的特征序列的期望评估作为奖励,通过强化学习的方式生成仿真网络流量的特征序列;所述判别器用于计算所述仿真网络流量或真实网络流量的特征序列对应的期望评估,并进行真伪判断;基于生成对抗交替训练所述生成器和所述判别器,基于生成对抗损失对所述生成器和所述判别器进行迭代更新,将迭代更新得到的所述生成器作为网络流量特征序列生成模型。2.根据权利要求1所述的网络流量特征序列生成模型的训练方法,其特征在于,获取指定的多个网络设备的网络流量,并以数据包序列的形式记录为第一设定格式文件,包括:部署tcpdump网络流量监控软件,收集指定多个网络设备的真实网络流量,所述网络设备包括边界网关、交换机、路由器和用户终端设备;所述第一设定格式文件为PCAP格式文件。3.根据权利要求1所述的网络流量特征序列生成模型的训练方法,其特征在于,采用预设工具提取各网络设备之间所述网络流量的基础特征、数据包特征、时间特征和恶意流量特征并记录为第二设定格式文件,包括:采用Argus工具和Bro

IDS工具提取各网络设备之间所述网络流量的基础特征、数据包特征、时间特征和恶意流量特征;所述第二设定格式文件为CSV格式文件。4.根据...

【专利技术属性】
技术研发人员:刘军李鉴学肖扬吴家威刘芳周文莉
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1