一种流量识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31928018 阅读:21 留言:0更新日期:2022-01-15 13:14
本申请实施例提供一种流量识别方法、装置、电子设备及存储介质,涉及数据安全技术领域。该方法包括对待识别流量进行压缩,以得到压缩率;将所述压缩率与预设的每类流量的阈值范围进行比较,以识别所述待识别流量的种类,所述流量的种类包括明文流量、编码流量和加密流量,对明文、编码和加密流量进行压缩,并利用压缩阈值来区分明文、编码和加密流量,解决现有方法训练模型需要消耗大量时间,且结果存在局限性的问题。局限性的问题。局限性的问题。

【技术实现步骤摘要】
一种流量识别方法、装置、电子设备及存储介质


[0001]本申请涉及数据安全
,具体而言,涉及一种流量识别方法、装置、电子设备及存储介质。

技术介绍

[0002]网络流量分类作为网络管理与网络安全的关键技术之一,不但能够优化网络配置,降低网络安全隐患,而且能够根据用户的行为分析提供更好的服务质量。网络流量分类作为网络管理的基础工作,一直是网络管理人员关注的重点。随着HTTPS、SSL等加密技术的普及和广泛使用,加密流量将占据网络流量的主体地位,加密流量的检测已成为网络流量分析的一个重要内容。此外,在当前大数据通信的环境下,为了保证数据的隐秘性,大量数据在网络传输过程中对原始数据进行了编码处理。对于网络中加密流量和编码流量以及明文流量的区分是一个十分现实而又迫切需要解决的问题。
[0003]现有的识别方法,如采用机器学习分类模型算法进行分类识别,该方法对采用基于随机性特征的加密和压缩流量识别时,需要提取大量数据的ECF特征,并且训练模型需要消耗大量时间,且结果存在局限性。

技术实现思路

[0004]本申请实施例的目的在于提供一种流量识别方法、装置、电子设备及存储介质,对明文、编码和加密流量进行压缩,并利用压缩阈值来区分明文、编码和加密流量,解决现有方法训练模型需要消耗大量时间,且结果存在局限性的问题。
[0005]本申请实施例提供了一种流量识别方法,该方法包括:
[0006]对待识别流量进行压缩,以得到压缩率;
[0007]将所述压缩率与预设的每类流量的阈值范围进行比较,以识别所述待识别流量的种类,所述流量的种类包括明文流量、编码流量和加密流量。
[0008]在上述实现过程中,利用压缩算法对每类流量进行压缩,以得到阈值范围,利用不同种类的流量的阈值范围不同,可实现对各类流量的识别,有效保证流量数据分类的准确性,避免了使用机器学习算法的局限性,从而解决了现有方法训练模型需要消耗大量时间,且结果存在局限性的问题。
[0009]进一步地,在所述将所述压缩率与预设的每类流量的阈值范围进行比较的步骤之前,所述方法还包括:
[0010]计算每类流量的阈值范围。
[0011]在上述实现过程中,通过计算每类流量的阈值范围,为待识别流量提供识别依据。
[0012]进一步地,所述计算每类流量的阈值范围,包括:
[0013]从外部网络中获取数据包,并进行解析,以获得载荷数据集,所述载荷数据集包括明文数据载荷数据集、编码数据载荷数据集和加密数据载荷数据集;
[0014]利用压缩算法分别对所述载荷数据集中的数据进行压缩,以得到压缩率集合,所
述压缩率为压缩后数据长度与压缩前数据长度之比;
[0015]根据所述压缩率集合计算每种载荷数据集的阈值范围。
[0016]在上述实现过程中,利用压缩算法对载荷数据集中的数据进行压缩,可得到压缩前后的长度比,进而得到压缩率,根据压缩率集合可得到每种流量的阈值范围。
[0017]进一步地,所述根据所述压缩率集合计算每种载荷数据集的阈值范围,包括:
[0018]计算所述压缩率集合的平均值和标准差;
[0019]利用所述平均值加减标准差的值确定每种载荷数据集的阈值范围。
[0020]在上述实现过程中,根据平均值加减标准差的值确定阈值范围,由于三种流量数据不同的特性,所得的阈值范围也会有明显的差别,因此可以进行三种流量的识别和区分。
[0021]进一步地,所述利用所述平均值加减标准差的值确定每种载荷数据集的阈值范围,包括:
[0022]若为明文数据载荷集,所述阈值范围表示为[a

b:a+b];
[0023]其中,a表示平均值,b表示标准差。
[0024]在上述实现过程中,标准差到平均值与标准差之和构成明文数据载荷集的阈值范围,若待检测流量的压缩率落入该范围则为明文流量。
[0025]本申请实施例还提供一种流量识别装置,所述装置包括:
[0026]压缩模块,用于对待识别流量进行压缩,以得到压缩率;
[0027]识别模块,用于将所述压缩率与预设的每类流量的阈值范围进行比较,以识别所述待识别流量的种类,所述流量的种类包括明文流量、编码流量和加密流量。
[0028]在上述实现过程中,利用压缩算法对每类流量进行压缩,以得到阈值范围,利用不同种类的流量的阈值范围不同,可实现对各类流量的识别,有效保证流量数据分类的准确性,避免了使用机器学习算法的局限性,从而解决了现有方法训练模型需要消耗大量时间,且结果存在局限性的问题。
[0029]进一步地,所述装置还包括:
[0030]阈值范围计算模块,用于计算每类流量的阈值范围。
[0031]在上述实现过程中,通过计算每类流量的阈值范围,为待识别流量提供识别依据。
[0032]所述阈值范围计算模块包括:
[0033]解析模块,用于从外部网络中获取数据包,并进行解析,以获得载荷数据集,所述载荷数据集包括明文数据载荷数据集、编码数据载荷数据集和加密数据载荷数据集;
[0034]集合获取模块,用于利用压缩算法分别对所述载荷数据集中的数据进行压缩,以得到压缩率集合,所述压缩率为压缩后数据长度与压缩前数据长度之比;
[0035]阈值范围获取模块,用于根据所述压缩率集合计算每种载荷数据集的阈值范围。
[0036]在上述实现过程中,利用压缩算法对载荷数据集中的数据进行压缩,可得到压缩前后的长度比,进而得到压缩率,根据压缩率集合可得到每种流量的阈值范围。
[0037]本申请实施例还提供一种电子设备,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行计算机程序以使计算机设备执行根据上述中任一项所述的流量识别方法。
[0038]本申请实施例还提供一种可读存储介质,所述可读存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行上述中任一项所述的流量识别
方法。
附图说明
[0039]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0040]图1为本申请实施例提供的一种流量识别方法的流程图;
[0041]图2为本申请实施例提供的明文、编码和加密流量的识别流程图;
[0042]图3为本申请实施例提供的阈值范围计算过程流程图;
[0043]图4为本申请实施例提供的流量识别装置的结构框图;
[0044]图5为本申请实施例提供的另一种流量识别装置的结构框图。
[0045]图标:
[0046]100

压缩模块;200

识别模块;300
...

【技术保护点】

【技术特征摘要】
1.一种流量识别方法,其特征在于,所述方法包括:对待识别流量进行压缩,以得到压缩率;将所述压缩率与预设的每类流量的阈值范围进行比较,以识别所述待识别流量的种类,所述流量的种类包括明文流量、编码流量和加密流量。2.根据权利要求1所述的流量识别方法,其特征在于,在所述将所述压缩率与预设的每类流量的阈值范围进行比较的步骤之前,所述方法还包括:计算每类流量的阈值范围。3.根据权利要求2所述的流量识别方法,其特征在于,所述计算每类流量的阈值范围,包括:从外部网络中获取数据包,并进行解析,以获得载荷数据集,所述载荷数据集包括明文数据载荷数据集、编码数据载荷数据集和加密数据载荷数据集;利用压缩算法分别对所述载荷数据集中的数据进行压缩,以得到压缩率集合,所述压缩率为压缩后数据长度与压缩前数据长度之比;根据所述压缩率集合计算每种载荷数据集的阈值范围。4.根据权利要求1所述的流量识别方法,其特征在于,所述根据所述压缩率集合计算每种载荷数据集的阈值范围,包括:计算所述压缩率集合的平均值和标准差;利用所述平均值加减标准差的值确定每种载荷数据集的阈值范围。5.根据权利要求4所述的流量识别方法,其特征在于,所述利用所述平均值加减标准差的值确定每种载荷数据集的阈值范围,包括:若为明文数据载荷集,所述阈值范围表示为[a

b:a+b];其中,a...

【专利技术属性】
技术研发人员:刘盈
申请(专利权)人:北京天融信网络安全技术有限公司北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1