模型训练方法、业务流量生成方法及相关设备技术

技术编号:39143362 阅读:10 留言:0更新日期:2023-10-23 14:55
本发明专利技术提供了模型训练方法、业务流量生成方法及相关设备,所述模型训练方法包括:基于获取的第一用户的抓包PCAP数据,得到第一数据集,所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签,所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定;基于所述业务类别信息标签和所述细分动作信息标签,生成数据分布表征向量,以及,基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签,生成用户行为表征向量;基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练,其中,训练的GAN模型用于生成业务流量包序列。提高了业务流量生成的准确性和效率。提高了业务流量生成的准确性和效率。提高了业务流量生成的准确性和效率。

【技术实现步骤摘要】
模型训练方法、业务流量生成方法及相关设备


[0001]本专利技术涉及互联网
,尤其涉及一种模型训练方法、业务流量生成方法及相关设备。

技术介绍

[0002]随着互联网云技术的发展,基于数字孪生空间可以进行众多的仿真测试工作。其中,业务流量是支撑各项网络安全和信息安全,支撑各项实验和测试工作的重要资源。因此,业务流量的生成受到越来越多的关注。
[0003]目前,业务流量的生成方法一般基于特定的规则或依赖于模板池生成流量,这种方式难以覆盖多种现网情况,也难以捕捉不同用户的行为偏好,缺少用户层面的精细划分;还有基于小波模型实现业务流量的生成,但是该方法不能保证生成流量数据的分布贴合实际流量数据的分布,针对同时生成不同业务对应的流量数据,难以在短时间内找到合适的小波基函数。
[0004]可见,现有技术中业务流量生成方法存在生成的流量准确性较差的问题。

技术实现思路

[0005]本专利技术实施例提供了一种模型训练方法、业务流量生成方法及相关设备,以解决现有技术中业务流量生成方法生成的流量准确性较差的问题。
[0006]为解决上述技术问题,本专利技术是这样实现的:
[0007]第一方面,本专利技术实施例提供了一种模型训练方法,所述方法包括:
[0008]基于获取的第一用户的抓包PCAP数据,得到第一数据集,所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签,所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定;
[0009]基于所述业务类别信息标签和所述细分动作信息标签,生成数据分布表征向量,以及,基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签,生成用户行为表征向量;
[0010]基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练,其中,训练的GAN模型用于生成业务流量包序列。
[0011]第二方面,本专利技术实施例提供了一种业务流量生成方法,所述方法包括:
[0012]获取对第二用户的PCAP数据处理后得到的数据分布表征向量和用户行为表征向量;
[0013]将第二拼接向量输入至预先训练的GAN模型中的生成器,生成业务流量包序列,所述第二拼接向量包括所述数据分布表征向量和所述用户行为表征向量;
[0014]其中,所述预先训练的GAN模型基于上述第一方面所述的模型训练方法对GAN模型训练得到。
[0015]第三方面,本专利技术实施例提供了一种模型训练装置,所述装置包括:
[0016]获取模块,用于基于获取的第一用户的抓包PCAP数据,得到第一数据集,所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签,所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定;
[0017]生成模块,用于基于所述业务类别信息标签和所述细分动作信息标签,生成数据分布表征向量,以及,基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签,生成用户行为表征向量;
[0018]训练模块,用于基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练,其中,训练的GAN模型用于生成业务流量包序列。
[0019]第四方面,本专利技术实施例提供了一种业务流量生成装置,所述装置包括:
[0020]获取模块,用于获取对第二用户的PCAP数据处理后得到的数据分布表征向量和用户行为表征向量;
[0021]生成模块,用于将第二拼接向量输入至预先训练的GAN模型中的生成器,生成业务流量包序列,所述第二拼接向量包括所述数据分布表征向量和所述用户行为表征向量。
[0022]第五方面,本专利技术实施例提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的模型训练方法的步骤,或实现如第二方面所述的业务流量生成方法的步骤。
[0023]第六方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的模型训练方法的步骤,或实现如第二方面所述的业务流量生成方法的步骤。
[0024]本专利技术实施例中,从多个第一用户的PCAP数据中提取第一数据,根据包长和包到达时刻这两个维度进行第一数据分组,并对第一数据进行标注,使得第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签。然后根据第一数据集中带有业务类别信息标签和细分动作信息标签的第一数据,生成数据分布表征向量,以从分布的程度上拟合真实数据;以及根据第一数据集中带有用户信息标签、所述业务类别信息标签和所述细分动作信息标签的第一数据,生成用户行为表征向量,以在用户层面上进行精细划分,使得GAN模型能够更好的了解用户行为偏好信息。从而,使用基于用户行为表征向量和数据分布表征向量训练的GAN模型来生成业务流量包序列,提高了业务流量生成的准确性和效率,可以有效的模拟用户的各种行为,使各个业务供应商能更好的规划网络服务,可应用于模拟城市网络环境的相关场景。相较于现有的业务流量生成方法,合成的数据逼真度更高,具有更好的应用价值。
附图说明
[0025]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0026]图1是本专利技术实施例提供的一种模型训练方法的流程图;
[0027]图2是本专利技术实施例提供的一种业务流量生成的架构图;
[0028]图3是本专利技术实施例提供的一种业务流量生成方法的流程图;
[0029]图4是本专利技术实施例提供的一种模型训练装置的结构示意图;
[0030]图5是本专利技术实施例提供的一种业务流量生成装置的结构示意图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]参见图1,图1是本专利技术实施例提供的一种模型训练方法的流程图,如图1所示,所述方法包括以下步骤:
[0033]步骤101、基于获取的第一用户的抓包PCAP数据,得到第一数据集,所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签,所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定;
[0034]第一用户可以是样本用户,可以通过Wire shark、SnifferPro、Snoop以及Tcpdump等抓包工具对第一用户进行各项业务操作时,数据通信过程中的所有PCAP数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:基于获取的第一用户的抓包PCAP数据,得到第一数据集,所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签,所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定;基于所述业务类别信息标签和所述细分动作信息标签,生成数据分布表征向量,以及,基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签,生成用户行为表征向量;基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练,其中,训练的GAN模型用于生成业务流量包序列。2.根据权利要求1所述的方法,其特征在于,所述基于所述业务类别信息标签和所述细分动作信息标签,生成数据分布表征向量,包括:根据所述业务类别信息标签和所述细分动作信息标签,对每个第一数据进行分组,得到第二数据组成的第二数据集,且所述业务类别信息标签和所述细分动作信息标签为所述第二数据的一部分;基于注意力机制,根据所述第二数据集,生成数据分布表征向量。3.根据权利要求1所述的方法,其特征在于,所述基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签,生成用户行为表征向量,包括:根据所述第一数据集中每个第一数据的所述用户信息标签、所述业务类别信息标签、所述细分动作信息标签,构建知识图谱,所述知识图谱用于表征所述第一用户对目标类别业务的使用偏好信息,以及所述第一用户在所述目标类别业务中的细分动作偏好信息;根据从所述知识图谱中获取的所述第一用户的偏好信息,生成用户行为表征向量。4.根据权利要求1所述的方法,其特征在于,所述基于获取的第一用户的抓包PCAP数据,得到第一数据集,包括:对获取的所述第一用户的PCAP数据进行数据提取,得到所述PCAP数据的包长和包到达时刻,并保留所述第一用户的用户信息和所述第一用户对应的业务类别信息;根据所述包长和所述包到达时刻,确定所述细分动作信息标签,以及根据所述第一用户的用户信息和所述第一用户对应的业务类别信息,分别确定所述用户信息标签和所述业务类别信息标签,以得到所述第一数据集。5.根据权利要求4所述的方法,其特征在于,所述根据所述包长和所述包到达时刻,确定所述细分动作信息标签,包括:根据先验知识确定所述PCAP数据包括的多个业务类别中第一类别业务的细分动作类别数目,并且确定所述细分动作类别数目的所述第一类别业务的类中心;根据所述类中心、所述包长和所述包到达时刻,对多个业务类别...

【专利技术属性】
技术研发人员:李勇李桐张师源黄丽思王昆李光宇
申请(专利权)人:中国移动通信集团有限公司研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1