【技术实现步骤摘要】
流量分类方法、模型训练方法、相关装置及存储介质
[0001]本申请涉及计算机
,尤其涉及一种流量分类方法、模型训练方法、相关装置及存储介质。
技术介绍
[0002]相关技术中,可以利用深度包检测(DPI,Deep Packet Inspection)技术或动态流量检测(DFI,Dynamic Flow Inspection)技术进行流量分类。然而,流量分类的准确性尚需提高。
技术实现思路
[0003]为解决相关技术问题,本申请实施例提供一种流量分类方法、模型训练方法、相关装置及存储介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供了一种模型训练方法,包括:
[0006]确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;
[0007]基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。
[0008]上述方案中,所述第一模型包含多个第一树节点;每个第一树节点对应所述多个维度的流量特征中的一个流量特征;所述训练第一模型,包括:
[0009]确定每个第一树节点对应的分类指数;所述分类指数表征相应流量特征对流量分类的影响程度;
[0010]基于每个第一树节点对应的分类指数,训练所述第一模型。
[0011]上述方案中,所述 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:确定训练数据集;所述训练数据集包含多个网络会话的流量特征信息以及每个网络会话对应的流量类型;所述流量特征信息能够反映相应网络会话的多个维度的流量特征;所述多个维度的流量特征的维度数满足第一条件;基于所述训练数据集,利用预设的树形结构的机器学习算法,训练第一模型;所述第一模型用于进行流量分类。2.根据权利要求1所述的方法,其特征在于,所述第一模型包含多个第一树节点;每个第一树节点对应所述多个维度的流量特征中的一个流量特征;所述训练第一模型,包括:确定每个第一树节点对应的分类指数;所述分类指数表征相应流量特征对流量分类的影响程度;基于每个第一树节点对应的分类指数,训练所述第一模型。3.根据权利要求2所述的方法,其特征在于,所述训练第一模型,还包括:确定每个第一树节点对应的分类阈值。4.根据权利要求1至3任一项所述的方法,其特征在于,所述流量特征信息包含以下至少之一:数据包数量的相关信息;数据包大小的相关信息;数据包传输的时间间隔的相关信息。5.根据权利要求4所述的方法,其特征在于,所述数据包数量的相关信息包含以下至少之一:第一传输方向所有数据包的总数量;第二传输方向所有数据包的总数量;所述第二传输方向与所述第一传输方向相反。6.根据权利要求4所述的方法,其特征在于,所述数据包大小的相关信息包含以下至少之一:第一传输方向所有数据包总的大小;第二传输方向所有数据包总的大小;所述第二传输方向与所述第一传输方向相反;第一传输方向数据包大小的最大值;第一传输方向数据包大小的最小值;第一传输方向数据包的平均大小;第二传输方向数据包大小的最大值;第二传输方向数据包大小的最小值;第二传输方向数据包的平均大小。7.根据权利要求4所述的方法,其特征在于,所述数据包传输的时间间隔的相关信息包含以下至少之一:传输第一传输方向所有数据包的总时间间隔;连续传输两个第一传输方向数据包的平均时间间隔;连续传输两个第一传输方向数据包的最大时间间隔;连续传输两个第一传输方向数据包的最小时间间隔;传输第二传输方向所有数据包的总时间间隔;所述第二传输方向与所述第一传输方向
相反;连续传输两个第二传输方向数据包的平均时间间隔;连续传输两个第二传输方向数据包的最大时间间隔;连续传输两个第二传输方向数据包的最小时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的平均时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的最大时间间隔;在第一传输方向和第二传输方向连续传输两个数据包的最小时间间隔。8....
【专利技术属性】
技术研发人员:何东标,余显,陈晓帆,刘怡江,
申请(专利权)人:深信服科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。