模型训练方法、业务流量生成方法及相关设备技术

技术编号：39143362 阅读：10 留言：0更新日期：2023-10-23 14:55

本发明专利技术提供了模型训练方法、业务流量生成方法及相关设备，所述模型训练方法包括：基于获取的第一用户的抓包PCAP数据，得到第一数据集，所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签，所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定；基于所述业务类别信息标签和所述细分动作信息标签，生成数据分布表征向量，以及，基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签，生成用户行为表征向量；基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练，其中，训练的GAN模型用于生成业务流量包序列。提高了业务流量生成的准确性和效率。提高了业务流量生成的准确性和效率。提高了业务流量生成的准确性和效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、业务流量生成方法及相关设备

[0001]本专利技术涉及互联网
，尤其涉及一种模型训练方法、业务流量生成方法及相关设备。

技术介绍

[0002]随着互联网云技术的发展，基于数字孪生空间可以进行众多的仿真测试工作。其中，业务流量是支撑各项网络安全和信息安全，支撑各项实验和测试工作的重要资源。因此，业务流量的生成受到越来越多的关注。
[0003]目前，业务流量的生成方法一般基于特定的规则或依赖于模板池生成流量，这种方式难以覆盖多种现网情况，也难以捕捉不同用户的行为偏好，缺少用户层面的精细划分；还有基于小波模型实现业务流量的生成，但是该方法不能保证生成流量数据的分布贴合实际流量数据的分布，针对同时生成不同业务对应的流量数据，难以在短时间内找到合适的小波基函数。
[0004]可见，现有技术中业务流量生成方法存在生成的流量准确性较差的问题。

技术实现思路

[0005]本专利技术实施例提供了一种模型训练方法、业务流量生成方法及相关设备，以解决现有技术中业务流量生成方法生成的流量准确性较差的问题。
[0006]为解决上述技术问题，本专利技术是这样实现的：
[0007]第一方面，本专利技术实施例提供了一种模型训练方法，所述方法包括：
[0008]基于获取的第一用户的抓包PCAP数据，得到第一数据集，所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签，所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定；
[0009...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：基于获取的第一用户的抓包PCAP数据，得到第一数据集，所述第一数据集中每个第一数据均包括用户信息标签、业务类别信息标签和细分动作信息标签，所述细分动作信息标签根据PCAP数据中包长和包到达时刻确定；基于所述业务类别信息标签和所述细分动作信息标签，生成数据分布表征向量，以及，基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签，生成用户行为表征向量；基于所述用户行为表征向量和所述数据分布表征向量对生成对抗网络GAN模型进行训练，其中，训练的GAN模型用于生成业务流量包序列。2.根据权利要求1所述的方法，其特征在于，所述基于所述业务类别信息标签和所述细分动作信息标签，生成数据分布表征向量，包括：根据所述业务类别信息标签和所述细分动作信息标签，对每个第一数据进行分组，得到第二数据组成的第二数据集，且所述业务类别信息标签和所述细分动作信息标签为所述第二数据的一部分；基于注意力机制，根据所述第二数据集，生成数据分布表征向量。3.根据权利要求1所述的方法，其特征在于，所述基于所述用户信息标签、所述业务类别信息标签和所述细分动作信息标签，生成用户行为表征向量，包括：根据所述第一数据集中每个第一数据的所述用户信息标签、所述业务类别信息标签、所述细分动作信息标签，构建知识图谱，所述知识图谱用于表征所述第一用户对目标类别业务的使用偏好信息，以及所述第一用户在所述目标类别业务中的细分动作偏好信息；根据从所述知识图谱中获取的所述第一用户的偏好信息，生成用户行为表征向量。4.根据权利要求1所述的方法，其特征在于，所述基于获取的第一用户的抓包PCAP数据，得到第一数据集，包括：对获取的所述第一用户的PCAP数据进行数据提取，得到所述PCAP数据的包长和包到达时刻，并保留所述第一用户的用户信息和所述第一用户对应的业务类别信息；根据所述包长和所述包到达时刻，确定所述细分动作信息标签，以及根据所述第一用户的用户信息和所述第一用户对应的业务类别信息，分别确定所述用户信息标签和所述业务类别信息标签，以得到所述第一数据集。5.根据权利要求4所述的方法，其特征在于，所述根据所述包长和所述包到达时刻，确定所述细分动作信息标签，包括：根据先验知识确定所述PCAP数据包括的多个业务类别中第一类别业务的细分动作类别数目，并且确定所述细分动作类别数目的所述第一类别业务的类中心；根据所述类中心、所述包长和所述包到达时刻，对多个业务类别...

【专利技术属性】
技术研发人员：李勇，李桐，张师源，黄丽思，王昆，李光宇，
申请(专利权)人：中国移动通信集团有限公司研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人