本申请公开了一种协议特征提取、确定及训练方法、装置、设备及介质;其中,所述方法包括:获取流量数据中数据包的协议数据;若所述协议数据中所包含字段值的数量小于目标数量,对所述协议数据进行处理,得到待提取数据;其中,所述待提取数据中所包含字段值的数量为所述目标数量;对所述待提取数据进行特征提取,得到所述流量数据的协议、特征。特征。特征。
【技术实现步骤摘要】
协议特征提取、确定及训练方法、装置、设备及介质
[0001]本申请涉及网络
,尤其涉及一种协议特征提取、确定及训练方法、装置、设备及介质。
技术介绍
[0002]在相关技术中,流量数据的协议特征,通常是从流量数据的数据包所包含的协议数据中提取得到的。然而,在实际应用中,海量数据包的协议数据波动较大,从而对协议数据的特征提取带来了极大的挑战。
[0003]因此,如何对数据包中包含的协议数据进行精准特征提取,成为亟待解决的问题。
技术实现思路
[0004]基于以上问题,本申请实施例提供了一种协议特征提取、确定及训练方法、装置、设备及介质。
[0005]本申请实施例提供的技术方案是这样的:
[0006]本申请实施例提供了一种协议特征提取方法,所述方法包括:
[0007]获取所述流量数据中数据包的协议数据;
[0008]若所述协议数据中所包含字段值的数量小于目标数量,对所述协议数据进行处理,得到待提取数据;其中,所述待提取数据中所包含字段值的数量为所述目标数量;
[0009]对所述待提取数据进行特征提取,得到所述流量数据的协议特征。
[0010]在一些实施例中,所述对所述协议数据进行处理,得到待提取数据之前,所述方法还包括:
[0011]获取配置信息;其中,所述配置信息包括至少两种类型的数据传输协议对应的协议字段;
[0012]将所述配置信息中与所述协议数据匹配的数据传输协议所包含协议字段的数量,确定为所述目标数量。
[0013]在一些实施例中,所述对所述协议数据进行处理,得到待提取数据,包括:
[0014]从所述配置信息中获取预设数据;
[0015]基于所述预设数据对所述协议数据中缺失的字段值进行补全处理,得到所述待提取数据。
[0016]在一些实施例中,所述对所述待提取数据进行特征提取,得到所述流量数据的协议特征,包括:
[0017]对所述待提取数据进行转换处理,得到转换结果;其中,所述转换结果中不包括指定类型的数据;
[0018]对所述转换结果中的字段值进行特征提取,得到所述协议特征。
[0019]在一些实施例中,所述对所述转换结果中的字段值进行特征提取之前,所述方法还包括:
[0020]获取所述转换结果中的初始字段值;
[0021]对所述初始字段值的取值范围进行调整,得到所述转换结果的字段值;其中,所述转换结果的字段值的取值范围,小于所述初始字段值的取值范围。
[0022]本申请实施例还提供了一种确定方法,所述方法包括:
[0023]获取流量数据中数据包的协议数据;
[0024]若所述协议数据中所包含字段值的数量小于目标数量,对所述协议数据进行处理,得到待提取数据;其中,所述待提取数据中所包含字段值的数量为所述目标数量;
[0025]对所述待提取数据进行特征提取,得到所述流量数据的协议特征;
[0026]基于所述协议特征,确定所述流量数据中至少一种通信协议的分布状态。
[0027]本申请实施例还提供了一种训练方法,所述方法包括:
[0028]获取流量数据中数据包的协议数据;
[0029]若所述协议数据中所包含字段值的数量小于目标数量,对所述协议数据进行处理,得到待提取数据;其中,所述待提取数据中所包含字段值的数量为所述目标数量;
[0030]对所述待提取数据进行特征提取,得到所述流量数据的协议特征;
[0031]基于所述协议特征对初始提取模型进行训练,得到提取模型。
[0032]本申请实施例还提供了一种协议特征提取装置,所述装置包括:
[0033]获取模块,用于获取流量数据中数据包的协议数据;
[0034]处理模块,用于若协议数据中包含字段值的数量小于目标数量,对协议数据进行处理,得到待提取数据;其中,待提取数据中所包含字段值的数量为目标数量;
[0035]特征提取模块,用于对待提取数据进行特征提取,得到所述流量数据的协议特征。
[0036]本申请实施例还提供了一种电子设备,所述设备包括处理器和存储器;其中,所述存储器中存储有计算机程序;所述计算机程序被所述处理器执行时,能够实现如前任一所述的协议特征提取方法。
[0037]本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序;所述计算机程序被电子设备的处理器执行时,能够实现如前任一所述的协议特征提取方法。
[0038]由以上可知,本申请实施例提供的协议特征提取方法,在获取流量数据中数据包的协议数据后,若协议数据中所包含字段值的数量小于目标数量,则对协议数据进行处理,使得通过上述方式得到的待提取数据中字段值的数量为目标数量,从而实现了对任意数据包中协议数据的字段值数量的统一化处理,使得任意待提取数据中包含的字段值均为目标数量,进而能够削弱数据包中协议数据的字段值波动对特征提取过程产生的消极影响,从而能够提高对待提取数据进行特征提取的效率,还能提高协议特征的全面性以及精度。
[0039]并且,通过对目标数量进行调整,能够实现对协议数据的多样化处理,从而实现了对协议数据中字段值的数量灵活的多样化的调整。
[0040]另一方面,在目标数量包括数据传输模型中字段值的情况下,通过上述方式得到的待提取数据,能够全面的包含标准化的、以及定制化的数据传输协议所应当包含的协议字段值,从而能够提高待提取数据中字段值的全面性和有效性。
附图说明
[0041]图1为本申请实施例提供的协议特征提取方法的流程示意图;
[0042]图2为本申请实施例提供的得到协议数据的流程示意图;
[0043]图3为本申请实施例提供的得到待提取数据的流程示意图;
[0044]图4为本申请实施例提供的协议特征提取方法的另一流程示意图;
[0045]图5为本申请实施例提供的确定方法的流程示意图;
[0046]图6为本申请实施例提供的训练方法的流程示意图;
[0047]图7为本申请实施例提供的协议特征提取装置的结构示意图;
[0048]图8为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0049]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0050]应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0051]随着网络技术的飞速发展,网络流量呈现爆炸式的增长。网络流量中包含了数据传输过程中的多种信息,比如协议交互信息,因此,对网络流量的分析比如对网络协议的特征提取,是网络带宽规划、网络入侵检测与防御、物联网(Internet of Things,IoT)资产识别、以及恶意流量检测等功能实现的重要前提。
[0052]但由于网络流量的中数据包所携带的协议数据中包含的协议字段数量的随机性,使得网络流量的解析以及协议特征提取面临着巨大的挑战本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种协议特征提取方法,其特征在于,所述方法包括:获取流量数据中数据包的协议数据;若所述协议数据中所包含字段值的数量小于目标数量,对所述协议数据进行处理,得到待提取数据;其中,所述待提取数据中所包含字段值的数量为所述目标数量;对所述待提取数据进行特征提取,得到所述流量数据的协议特征。2.根据权利要求1所述的方法,其特征在于,所述对所述协议数据进行处理,得到待提取数据之前,所述方法还包括:获取配置信息;其中,所述配置信息包括至少两种类型的数据传输协议对应的协议字段;将所述配置信息中所包含协议字段的数量,确定为所述目标数量。3.根据权利要求2所述的方法,其特征在于,所述对所述协议数据进行处理,得到待提取数据,包括:从所述配置信息中获取预设数据;基于所述预设数据对所述协议数据中缺失的字段值进行补全处理,得到所述待提取数据。4.根据权利要求1所述的方法,其特征在于,所述对所述待提取数据进行特征提取,得到所述流量数据的协议特征,包括:对所述待提取数据进行转换处理,得到转换结果;其中,所述转换结果中不包括指定类型的数据;对所述转换结果中的字段值进行特征提取,得到所述协议特征。5.根据权利要求4所述的方法,其特征在于,所述对所述转换结果中的字段值进行特征提取之前,所述方法还包括:获取所述转换结果中的初始字段值;对所述初始字段值的取值范围进行调整,得到所述转换结果的字段值;其中,所述转换结果的字段值的取值范围,小于所述初始字段值的取值范围。6.一种确定方法,其特征在于,所述方法包括:获取流量数据中数据包的协议数据;若所述协议数据中所包含字段值的数量小于目标数...
【专利技术属性】
技术研发人员:黄子恒,张星,关雪松,葛继声,李春辉,
申请(专利权)人:深信服科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。