【技术实现步骤摘要】
网络流量的特征提取方法及装置、设备、存储介质
[0001]本申请涉及网络
,尤其涉及一种网络流量的特征提取方法及装置、设备、存储介质。
技术介绍
[0002]随着互联网的普及和网络技术的快速发展,网络流量呈现爆炸式增长,网络流量中包含着设备之间的交互信息,因此对网络流量的分析,是网络带宽规划、网络入侵检测与防御、物联网(Internet of Things,IOT)资产识别以及恶意流量检测等任务的重要前提,但网络流量的加密,内容随机性等特性也使分析其面临着巨大的挑战。相关技术中,一般采用基于机器学习的流量分类方法,对网络流量进行分析,而用于流量分类的机器学习模型的训练样本往往是网络流量的整个抓包文件。由于整个抓包文件存在大量无效信息,会使得机器学习模型容易学习到无关信息,对重要特征反而学习不到。
[0003]因此,相关技术存在提取的网络流量特征不准确的问题。
技术实现思路
[0004]本申请主要提供一种网络流量的特征提取方法及装置、设备、存储介质,能够克服相关技术中提取的网络流量特征不准确的问题。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种网络流量的特征提取方法,包括:
[0007]获取待检测流量;所述待检测流量包括多个流量包;每一所述流量包包括:协议数据以及网络载荷数据;
[0008]针对多个所述流量包中的每一所述流量包,根据所述协议数据,提取所述流量包对应的协议特征;
[0009]根据所述网络载荷数据, ...
【技术保护点】
【技术特征摘要】
1.一种网络流量的特征提取方法,其特征在于,包括:获取待检测流量;所述待检测流量包括多个流量包;每一所述流量包包括:协议数据以及网络载荷数据;针对多个所述流量包中的每一所述流量包,根据所述协议数据,提取所述流量包对应的协议特征;根据所述网络载荷数据,提取所述流量包对应的字符特征;对所述协议特征和所述字符特征进行融合处理,得到所述流量包的一个子特征,确定多个所述流量包对应的多个所述子特征为所述待检测流量的目标特征。2.根据权利要求1所述的方法,其特征在于,所述协议数据包括:多个协议类型中的每一所述协议类型对应的标头字段;所述根据所述协议数据,提取所述流量包对应的协议特征,包括:解析每一所述协议类型对应的所述标头字段,得到每一所述协议类型对应的字段特征集合;利用预设程序,在多个所述协议类型分别对应的所述字段特征集合中,按照预定顺序提取至少一个预设协议类型对应的初始协议特征;对所述初始协议特征进行归一化处理得到所述协议特征。3.根据权利要求2所述的方法,其特征在于,所述在多个所述协议类型分别对应的所述字段特征集合中,按照预定顺序提取至少一个预设协议类型对应的初始协议特征,包括:在多个所述字段特征集合中,确定属于至少一个所述预设协议类型分别对应的中间字段特征集合;按照至少一个所述预设协议类型的预定协议类型顺序,对至少一个所述中间字段特征集合进行排序;依次在各个所述中间字段特征集合中按照预定字段顺序提取字段特征;按照至少一个所述中间字段特征集合的次序,将各个所述中间字段特征集合对应的所述字段特征排序,得到字段特征矩阵,确定所述字段特征矩阵为所述初始协议特征。4.根据权利要求3所述的方法,其特征在于,所述中间字段特征集合包括:至少一个字段;所述依次在各个所述中间字段特征集合中按照预定字段顺序提取字段特征,包括以下之一:在所述中间字段特征集合中存在属于N个预设字段类别的字段的情况下,在至少一个所述字段中按照N个所述预设字段类别顺序依次提取属于N个所述预设字段类别的N个字段,确定所述N个字段为所述字段特征;N为大于或者等于1的整数;在所述中间字段特征集合中不存在属于第一预设字段类别的字段的情况下,将空白字段作为与所述第一预设字段类别对应的字段,在至少一个所述字段中按照N个所述预设字段类别顺序依次提取属于N个所述预设字段类别的N个字段,确定所述N个字段为所述字段特征;所述第一预设字段类别属于N个所述预设字段类别。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述字符特征包括字符频率特征以及字符语义特征;所述根据所述网络载荷数据,提取所述流量包对应的字符特征;包括:
获取预设字符集合;根据所述网络载荷数据以及所述预设字符集合,确定所述字符频率特征;根据所述网络载荷数据以及词向量模型,确定所述字符语义特...
【专利技术属性】
技术研发人员:张星,黄子恒,李春辉,关雪松,葛继声,
申请(专利权)人:深信服科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。