网络流量的特征提取方法及装置、设备、存储介质制造方法及图纸

技术编号:36929813 阅读:35 留言:0更新日期:2023-03-22 18:52
本申请提供了一种网络流量的特征提取方法及装置、电子设备、存储介质,方法包括:获取待检测流量;针对多个流量包中的每一流量包,根据协议数据,提取流量包对应的协议特征;根据网络载荷数据,提取流量包对应的字符特征;对协议特征和字符特征进行融合处理,得到流量包的一个子特征,确定多个流量包对应的多个子特征为待检测流量的目标特征。这样,融合后得到的子特征有效融合了协议特征的信息以及字符特征的信息,使得子特征能够有效的表征每一流量包的流量特征,进而在将多个流量包对应的多个子特征确定为待检测流量的目标特征时,也可以使得目标特征够有效的表征待检测流量的流量特征。流量特征。流量特征。

【技术实现步骤摘要】
网络流量的特征提取方法及装置、设备、存储介质


[0001]本申请涉及网络
,尤其涉及一种网络流量的特征提取方法及装置、设备、存储介质。

技术介绍

[0002]随着互联网的普及和网络技术的快速发展,网络流量呈现爆炸式增长,网络流量中包含着设备之间的交互信息,因此对网络流量的分析,是网络带宽规划、网络入侵检测与防御、物联网(Internet of Things,IOT)资产识别以及恶意流量检测等任务的重要前提,但网络流量的加密,内容随机性等特性也使分析其面临着巨大的挑战。相关技术中,一般采用基于机器学习的流量分类方法,对网络流量进行分析,而用于流量分类的机器学习模型的训练样本往往是网络流量的整个抓包文件。由于整个抓包文件存在大量无效信息,会使得机器学习模型容易学习到无关信息,对重要特征反而学习不到。
[0003]因此,相关技术存在提取的网络流量特征不准确的问题。

技术实现思路

[0004]本申请主要提供一种网络流量的特征提取方法及装置、设备、存储介质,能够克服相关技术中提取的网络流量特征不准确的问题。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种网络流量的特征提取方法,包括:
[0007]获取待检测流量;所述待检测流量包括多个流量包;每一所述流量包包括:协议数据以及网络载荷数据;
[0008]针对多个所述流量包中的每一所述流量包,根据所述协议数据,提取所述流量包对应的协议特征;
[0009]根据所述网络载荷数据,提取所述流量包对应的字符特征;
[0010]对所述协议特征和所述字符特征进行融合处理,得到所述流量包的一个子特征,确定多个所述流量包对应的多个所述子特征为所述待检测流量的目标特征。
[0011]本申请实施例提供一种网络流量的特征提取装置,所述装置包括:
[0012]获取单元,用于获取待检测流量;所述待检测流量包括多个流量包;每一所述流量包包括:协议数据以及网络载荷数据;
[0013]提取单元,用于针对多个所述流量包中的每一所述流量包,根据所述协议数据,提取所述流量包对应的协议特征;
[0014]所述提取单元,还用于根据所述网络载荷数据,提取所述流量包对应的字符特征;
[0015]融合单元,用于对所述协议特征和所述字符特征进行融合处理,得到所述流量包的一个子特征,确定多个所述流量包对应的多个所述子特征为所述待检测流量的目标特征。
[0016]本申请实施例提供一种网络流量的特征提取设备,包括:
[0017]存储器,用于存储可执行指令;
[0018]处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的网络流量的特征提取方法。
[0019]本申请实施例提供一种存储介质,所述存储介质上存储有可执行指令,该可执行指令被处理器执行时实现申请实施例提供的网络流量的特征提取方法。
[0020]本申请实施例具有以下有益效果:
[0021]本申请实施例根据对待检测流量的多个流量包中的每一流量包的协议数据进行特征提取,得到每一流量包对应的协议特征;对每一流量包的网络载荷数据进行特征提取,得到每一流量包对应的字符特征;然后对每一流量包对应的协议特征以及字符特征进行融合处理,得到每一个流量包对应的一个子特征。这样,每一个流量包对应的子特征有效融合了协议特征的信息以及字符特征的信息,使得子特征能够有效的表征每一流量包的流量特征,进而在将多个流量包对应的多个子特征确定为待检测流量的目标特征时,可以获得更加全面、丰富的目标特征。如此,提高了网络流量特征的准确性。
附图说明
[0022]图1为本申请实施例提供的网络流量的特征提取的一个可选的流程示意图;
[0023]图2为本申请实施例提供的网络流量的特征提取方法的一个可选的流程示意图;
[0024]图3为本申请实施例提供的网络流量的特征提取方法的一个可选的流程示意图;
[0025]图4为本申请实施例提供的网络流量的特征提取方法的一个可选的流程示意图;
[0026]图5为本申请实施例提供的网络流量的特征提取方法的一个可选的流程示意图;
[0027]图6为本申请实施例提供的网络流量的特征提取装置的组成结构示意图;
[0028]图7为本申请实施例提供的网络流量的特征提取设备的组成结构示意图。
具体实施方式
[0029]下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。
[0030]为了使本
的人员更好地理解本公开实施例方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。
[0031]本申请的说明书实施例和权利要求书及上述附图中的术语“第一”、“第二”、和“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0032]本申请实施例提供一种网络流量的特征提取方法,本申请实施例可以应用于各种电子设备中,该电子设备包括但不限于固定设备和/或移动设备,例如,所述固定设备包括但不限于:个人电脑(Personal Computer,PC)、或者服务器等,所述服务器可以是云服务器或普通服务器。所述移动设备包括但不限于:手机、平板电脑或可穿戴式设备中的一项或是多项。
[0033]图1为本申请实施例的网络流量的特征提取方法的流程图,如图1所示,该流程可
以包括:
[0034]S101、获取待检测流量。
[0035]其中,所述待检测流量包括多个流量包;多个所述流量包中的每一所述流量包包括:协议数据以及网络载荷数据。这里,待检测流量可以是目标设备的网络流量,该网络流量可以包括目标设备发送的网络流量,也可以包括目标设备接收的网络流量。在一些实施例中,上述目标设备可以是IOT设备。
[0036]在一些实施例中,特征提取装置拦截从目标设备发出的网络流量或者其他设备向目标设备发送的网络流量。该特征提取装置可以被设置在目标设备一侧网络的交换机上,从而获取到与目标设备进行交互的网络流量。
[0037]在一些实施例中,特征提取装置可以是例如tcpdump等开源的抓包工具,也可以是流量采集探针。
[0038]在一些实施例中,获取待检测流量包括:特征提取装置获取目标设备的目标地址;根据目标设备的目标地址,利用流量获取设备拦截获取待检测流量。
[0039]在一些实施例中,通过特征提取装置拦截到待检测流量之后,可以获得待检测流量包括的多个流量包。其中,每一个流量包可以包括协议数据以及网络载荷数据。该协议数据可以为流量包在网络模型的各层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络流量的特征提取方法,其特征在于,包括:获取待检测流量;所述待检测流量包括多个流量包;每一所述流量包包括:协议数据以及网络载荷数据;针对多个所述流量包中的每一所述流量包,根据所述协议数据,提取所述流量包对应的协议特征;根据所述网络载荷数据,提取所述流量包对应的字符特征;对所述协议特征和所述字符特征进行融合处理,得到所述流量包的一个子特征,确定多个所述流量包对应的多个所述子特征为所述待检测流量的目标特征。2.根据权利要求1所述的方法,其特征在于,所述协议数据包括:多个协议类型中的每一所述协议类型对应的标头字段;所述根据所述协议数据,提取所述流量包对应的协议特征,包括:解析每一所述协议类型对应的所述标头字段,得到每一所述协议类型对应的字段特征集合;利用预设程序,在多个所述协议类型分别对应的所述字段特征集合中,按照预定顺序提取至少一个预设协议类型对应的初始协议特征;对所述初始协议特征进行归一化处理得到所述协议特征。3.根据权利要求2所述的方法,其特征在于,所述在多个所述协议类型分别对应的所述字段特征集合中,按照预定顺序提取至少一个预设协议类型对应的初始协议特征,包括:在多个所述字段特征集合中,确定属于至少一个所述预设协议类型分别对应的中间字段特征集合;按照至少一个所述预设协议类型的预定协议类型顺序,对至少一个所述中间字段特征集合进行排序;依次在各个所述中间字段特征集合中按照预定字段顺序提取字段特征;按照至少一个所述中间字段特征集合的次序,将各个所述中间字段特征集合对应的所述字段特征排序,得到字段特征矩阵,确定所述字段特征矩阵为所述初始协议特征。4.根据权利要求3所述的方法,其特征在于,所述中间字段特征集合包括:至少一个字段;所述依次在各个所述中间字段特征集合中按照预定字段顺序提取字段特征,包括以下之一:在所述中间字段特征集合中存在属于N个预设字段类别的字段的情况下,在至少一个所述字段中按照N个所述预设字段类别顺序依次提取属于N个所述预设字段类别的N个字段,确定所述N个字段为所述字段特征;N为大于或者等于1的整数;在所述中间字段特征集合中不存在属于第一预设字段类别的字段的情况下,将空白字段作为与所述第一预设字段类别对应的字段,在至少一个所述字段中按照N个所述预设字段类别顺序依次提取属于N个所述预设字段类别的N个字段,确定所述N个字段为所述字段特征;所述第一预设字段类别属于N个所述预设字段类别。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述字符特征包括字符频率特征以及字符语义特征;所述根据所述网络载荷数据,提取所述流量包对应的字符特征;包括:
获取预设字符集合;根据所述网络载荷数据以及所述预设字符集合,确定所述字符频率特征;根据所述网络载荷数据以及词向量模型,确定所述字符语义特...

【专利技术属性】
技术研发人员:张星黄子恒李春辉关雪松葛继声
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1