流量分类方法、模型训练方法、相关装置及存储介质制造方法及图纸

技术编号:37465433 阅读:34 留言:0更新日期:2023-05-06 09:39
本申请公开了一种模型训练方法、流量分类方法、模型训练装置、流量分类装置、第一电子设备、第二电子设备及存储介质。其中,所述模型训练方法包括:确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。行流量分类。行流量分类。

【技术实现步骤摘要】
流量分类方法、模型训练方法、相关装置及存储介质


[0001]本申请涉及计算机
,尤其涉及一种流量分类方法、模型训练方法、相关装置及存储介质。

技术介绍

[0002]相关技术中,可以利用深度包检测(DPI,Deep Packet Inspection)技术或动态流量检测(DFI,Dynamic Flow Inspection)技术进行流量分类。然而,流量分类的准确性尚需提高。

技术实现思路

[0003]为解决相关技术问题,本申请实施例提供一种流量分类方法、模型训练方法、相关装置及存储介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供了一种模型训练方法,包括:
[0006]确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;
[0007]基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。
[0008]上述方案中,所述第一模型包含多个第一树节点;每个第一树节点对应所述多个维度的流量特征中的一个流量特征;所述训练第一模型,包括:
[0009]确定每个第一树节点对应的分类指数;所述分类指数表征相应流量特征对流量分类的影响程度;
[0010]基于每个第一树节点对应的分类指数,训练所述第一模型。
[0011]上述方案中,所述训练第一模型,还包括:
[0012]确定每个第一树节点对应的分类阈值。
[0013]上述方案中,所述流量特征信息包含以下至少之一:
[0014]数据包数量的相关信息;
[0015]数据包大小的相关信息;
[0016]数据包传输的时间间隔的相关信息。
[0017]上述方案中,所述数据包数量的相关信息包含以下至少之一:
[0018]第一传输方向所有数据包的总数量;
[0019]第二传输方向所有数据包的总数量;所述第二传输方向与所述第一传输方向相反。
[0020]上述方案中,所述数据包大小的相关信息包含以下至少之一:
[0021]第一传输方向所有数据包总的大小;
[0022]第二传输方向所有数据包总的大小;所述第二传输方向与所述第一传输方向相反;
[0023]第一传输方向数据包大小的最大值;
[0024]第一传输方向数据包大小的最小值;
[0025]第一传输方向数据包的平均大小;
[0026]第二传输方向数据包大小的最大值;
[0027]第二传输方向数据包大小的最小值;
[0028]第二传输方向数据包的平均大小。
[0029]上述方案中,所述数据包传输的时间间隔的相关信息包含以下至少之一:
[0030]传输第一传输方向所有数据包的总时间间隔;
[0031]连续传输两个第一传输方向数据包的平均时间间隔;
[0032]连续传输两个第一传输方向数据包的最大时间间隔;
[0033]连续传输两个第一传输方向数据包的最小时间间隔;
[0034]传输第二传输方向所有数据包的总时间间隔;所述第二传输方向与所述第一传输方向相反;
[0035]连续传输两个第二传输方向数据包的平均时间间隔;
[0036]连续传输两个第二传输方向数据包的最大时间间隔;
[0037]连续传输两个第二传输方向数据包的最小时间间隔;
[0038]在第一传输方向和第二传输方向连续传输两个数据包的平均时间间隔;
[0039]在第一传输方向和第二传输方向连续传输两个数据包的最大时间间隔;
[0040]在第一传输方向和第二传输方向连续传输两个数据包的最小时间间隔。
[0041]本申请实施例还提供了一种流量分类方法,包括:
[0042]获取第一网络会话的多个数据包;
[0043]根据获取的多个数据包,确定所述第一网络会话的流量特征信息;所述流量特征信息能够反映所述第一网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;
[0044]根据确定的流量特征信息,利用第一模型,确定所述第一网络会话对应的流量类型;所述第一模型利用上述任一模型训练方法得到。
[0045]上述方案中,所述获取第一网络会话的多个数据包,包括:
[0046]获取所述第一网络会话在第一时间范围内传输的多个数据包。
[0047]上述方案中,所述根据确定的流量特征信息,利用第一模型,确定所述第一网络会话对应的流量类型,包括:
[0048]针对所述流量特征信息包含的每个维度的流量特征的特征值,利用所述第一模型,将相应流量特征的特征值与对应的分类阈值进行比较,得到比较结果;根据所述比较结果,确定所述第一网络会话对应的流量类型。
[0049]上述方案中,所述确定所述第一网络会话对应的流量类型,包括以下之一:
[0050]确定所述第一网络会话对应交互类流量;
[0051]确定所述第一网络会话对应传输类流量;
[0052]确定所述第一网络会话对应实时类流量。
[0053]上述方案中,所述确定所述第一网络会话的流量特征信息,包括:
[0054]根据所述多个数据包,利用DPI技术,确定所述第一网络会话对应的流量类型;
[0055]在利用DPI技术无法确定所述第一网络会话对应的流量类型的情况下,确定所述第一网络会话的流量特征信息。
[0056]本申请实施例还提供了一种模型训练装置,包括:
[0057]第一处理单元,用于确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;
[0058]第二处理单元,用于基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。
[0059]本申请实施例还提供了一种流量分类装置,包括:
[0060]获取单元,用于获取第一网络会话的多个数据包;
[0061]第三处理单元,用于根据获取的多个数据包,确定所述第一网络会话的流量特征信息;所述流量特征信息能够反映所述第一网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;
[0062]第四处理单元,用于根据确定的流量特征信息,利用第一模型,确定所述第一网络会话对应的流量类型;所述第一模型利用上述任一模型训练方法得到。
[0063]本申请实施例还提供了一种第一电子设备,包括:第一处理器和用于存储能够在处理器上运行的计算机程序的第一存储器,
[0064]其中,所述第一处理器用于运行所述计算机程序时,执行上述任一模型训练方法的步骤。
[006本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。2.根据权利要求1所述的方法,其特征在于,所述第一模型包含多个第一树节点;每个第一树节点对应所述多个维度的流量特征中的一个流量特征;所述训练第一模型,包括:确定每个第一树节点对应的分类指数;所述分类指数表征相应流量特征对流量分类的影响程度;基于每个第一树节点对应的分类指数,训练所述第一模型。3.根据权利要求2所述的方法,其特征在于,所述训练第一模型,还包括:确定每个第一树节点对应的分类阈值。4.根据权利要求1至3任一项所述的方法,其特征在于,所述流量特征信息包含以下至少之一:数据包数量的相关信息;数据包大小的相关信息;数据包传输的时间间隔的相关信息。5.根据权利要求4所述的方法,其特征在于,所述数据包数量的相关信息包含以下至少之一:第一传输方向所有数据包的总数量;第二传输方向所有数据包的总数量;所述第二传输方向与所述第一传输方向相反。6.根据权利要求4所述的方法,其特征在于,所述数据包大小的相关信息包含以下至少之一:第一传输方向所有数据包总的大小;第二传输方向所有数据包总的大小;所述第二传输方向与所述第一传输方向相反;第一传输方向数据包大小的最大值;第一传输方向数据包大小的最小值;第一传输方向数据包的平均大小;第二传输方向数据包大小的最大值;第二传输方向数据包大小的最小值;第二传输方向数据包的平均大小。7.根据权利要求4所述的方法,其特征在于,所述数据包传输的时间间隔的相关信息包含以下至少之一:传输第一传输方向所有数据包的总时间间隔;连续传输两个第一传输方向数据包的平均时间间隔;连续传输两个第一传输方向数据包的最大时间间隔;连续传输两个第一传输方向数据包的最小时间间隔;传输第二传输方向所有数据包的总时间间隔;所述第二传输方向与所述第一传输方向
相反;连续传输两个第二传输方向数据包的平均时间间隔;连续传输两个第二传输方向数据包的最大时间间隔;连续传输两个第二传输方向数据包的最小时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的平均时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的最大时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的最小时间间隔。8....

【专利技术属性】
技术研发人员:何东标余显陈晓帆刘怡江
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1