HTTPS流量识别方法、装置、终端设备及存储介质制造方法及图纸

技术编号:18240519 阅读:50 留言:0更新日期:2018-06-17 05:17
本发明专利技术公开了一种HTTPS流量识别方法、装置、终端设备及存储介质,所述HTTPS流量识别方法包括:获取HTTPS流量数据;根据预设的计算口径计算所述HTTPS流量数据的每一XDR特征变量,得到所述HTTPS流量数据的全部XDR特征变量;将所述HTTPS流量数据的全部XDR特征变量输入预先创建的支持向量机分类模型,得到所述HTTPS流量数据对应的流量类型;其中,所述流量类型为图片流量或非图片流量;所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,所述样本流量数据为已标记为图片流量和非图片流量的数据。采用本发明专利技术实施例能够降低HTTPS流量的图片流量识别的数据获取难度和计算复杂度,降低识别成本。 1

HTTPS traffic identification method, device, terminal device and storage medium

The invention discloses a HTTPS traffic identification method, a device, a terminal device and a storage medium. The HTTPS flow recognition method includes obtaining HTTPS traffic data, calculating each XDR characteristic variable of the HTTPS traffic data according to the preset calculation caliber, and obtaining all the XDR feature variables of the HTTPS traffic data; All the XDR feature variables of the HTTPS traffic data are entered into a pre created support vector machine classification model to obtain the flow type corresponding to the HTTPS traffic data, in which the flow type is a picture flow or a non picture flow, and the support vector machine classification model changes the XDR characteristics of the sample flow data established before. The volume data is pre created, and the sample traffic data is data marked as picture traffic and non picture traffic. The embodiment of the invention can reduce data acquisition difficulty and computational complexity of image flow recognition of HTTPS traffic, and reduce identification cost. One

【技术实现步骤摘要】
HTTPS流量识别方法、装置、终端设备及存储介质
本专利技术涉及移动互联网业务流量识别
,尤其涉及一种HTTPS流量识别方法、装置、终端设备以及存储介质。
技术介绍
HTTPS是一种保证网页数据安全传输的加密协议。在HTTPS协议中,HTTP负责网页数据的传输,SSL/TLS协议负责数据加密和身份认证。目前,HTTPS协议已经被广泛地应用到网络银行、网络支付、电子商务等重要服务中。众多Web站点为了自身在通讯过程中的安全,也都通过HTTPS协议来进行数据传输。而流量识别和分类是一种有效的网络管理手段,它通过主动获取网络流量,对其进行分析,全面地了解当前网络环境中各种网络应用的运行状况,因此,实现HTTPS流量识别具有重要的意义。然而,现有方案通过DFI技术获取IP流特征对HTTPS流量进行识别,数据获取难度大,计算复杂度高,实现识别成本高,可行性较差。
技术实现思路
本专利技术实施例提供一种HTTPS流量识别方法、装置、终端设备以及存储介质,能有效解决现有HTTPS流量识别技术数据获取难度大,计算复杂度高,可行性较差的技术问题。本专利技术一实施例提供一种HTTPS流量识别方法,包括:获取HTTPS流量数据;根据预设的计算口径计算所述HTTPS流量数据的每一XDR特征变量,得到所述HTTPS流量数据的全部XDR特征变量;将所述HTTPS流量数据的全部XDR特征变量输入预先创建的支持向量机分类模型,得到所述HTTPS流量数据对应的流量类型;其中,所述流量类型为图片流量或非图片流量;所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,所述样本流量数据为已标记为图片流量和非图片流量的数据。优选地,所述每一XDR特征变量及其对应的计算口径如下表所示:优选地,所述所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,具体包括:对样本流量数据进行不放回抽样,生成训练集和测试集;对训练集中的XDR特征变量数据进行支持向量机训练,得到可用于识别图片流量和非图片流量的支持向量机分类模型。优选地,使用测试集中的XDR特征变量数据测试所述支持向量机分类模型的分类结果,计算分类结果的查准率、查全率和F值,对所述支持向量机分类模型的参数进行优化。优选地,在所述获取HTTPS流量数据后,还包括:对所述HTTPS流量数据进行清洗,包括用“0”填补空缺值,剔除噪声数据、极大值和极小值,以及对HTTPS流量数据进行离散化处理。优选地,所述HTTPS流量识别方法还包括:分别将识别为图片流量和非图片流量的HTTPS流量数据的SSL/TLS协议头中包含的服务器HOST提取出来;根据预设的HOST业务类型对应表得到所述图片流量和所述非图片流量所对应的业务类型。与现有技术相比,本专利技术实施例公开的HTTPS流量识别方法基于样本流量数据的XDR特征变量数据建立支持向量机分类模型,对HTTPS流量数据的图片流量和非图片流量进行识别,所述XDR特征变量根据计算口径计算获取,减少了数据获取难度和计算复杂度,降低流量识别成本;通过使用查准率、查全率和F值三个关键指标为依据对支持向量机分类模型进行参数优化,提高了流量分类的精度。本专利技术另一实施例对应提供了一种HTTPS流量识别装置,包括:流量数据获取模块,用于获取HTTPS流量数据;特征变量计算模块,用于根据预设的计算口径计算所述HTTPS流量数据的每一XDR特征变量,得到所述HTTPS流量数据的全部XDR特征变量;流量数据识别模块,用于将所述HTTPS流量数据的全部XDR特征变量输入预先创建的支持向量机分类模型,得到所述HTTPS流量数据对应的流量类型;其中,所述流量类型为图片流量或非图片流量;所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,所述样本流量数据为已标记为图片流量和非图片流量的数据。优选地,所述HTTPS流量识别装置,还包括:流量数据清洗模块,用于对所述HTTPS流量数据进行清洗,包括用“0”填补空缺值,剔除噪声数据、极大值和极小值,以及对HTTPS流量数据进行离散化处理。与现有技术相比,本专利技术实施例公开的HTTPS流量识别方法基于样本流量数据的XDR特征变量数据建立支持向量机分类模型,对HTTPS流量数据的图片流量和非图片流量进行识别,所述XDR特征变量根据计算口径计算获取,减少了数据获取难度和计算复杂度,降低流量识别成本;通过使用查准率、查全率和F值三个关键指标为依据对支持向量机分类模型进行参数优化,提高了流量分类的精度。本专利技术另一实施例提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述专利技术实施例所述的HTTPS流量识别方法。本专利技术另一实施例提供了一种存储介质,其特征在于,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行上述专利技术实施例所述的HTTPS流量识别方法。附图说明图1是本专利技术第一实施例提供的一种HTTPS流量识别方法的流程示意图。图2是本专利技术第二实施例提供的一种HTTPS流量识别方法的流程示意图。图3是本专利技术第三实施例提供的一种HTTPS流量识别装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术第一实施例提供的一种HTTPS流量识别方法的流程示意图,所述HTTPS流量识别方法包括:S101、获取HTTPS流量数据;S102、根据预设的计算口径计算所述HTTPS流量数据的每一XDR特征变量,得到所述HTTPS流量数据的全部XDR特征变量;在本实施例中,所述每一XDR特征变量及其对应的计算口径如下表所示:S103、将所述HTTPS流量数据的全部XDR特征变量输入预先创建的支持向量机分类模型,得到所述HTTPS流量数据对应的流量类型;其中,所述流量类型为图片流量或非图片流量。所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,所述样本流量数据为已标记为图片流量和非图片流量的数据。在本实施例中,所述所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,具体包括:对样本流量数据进行不放回抽样,生成训练集和测试集。对训练集中的XDR特征变量数据进行支持向量机训练,得到可用于识别图片流量和非图片流量的支持向量机分类模型。优选地,使用测试集中的XDR特征变量数据测试所述支持向量机分类模型的分类结果,计算分类结果的查准率、查全率和F值,对所述支持向量机分类模型的参数进行优化。所述支持向量机(SVM)是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。所述支持向量机应用核函数的展开定理,不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,所本文档来自技高网...
HTTPS流量识别方法、装置、终端设备及存储介质

【技术保护点】
1.一种HTTPS流量识别方法,其特征在于,包括:

【技术特征摘要】
1.一种HTTPS流量识别方法,其特征在于,包括:获取HTTPS流量数据;根据预设的计算口径计算所述HTTPS流量数据的每一XDR特征变量,得到所述HTTPS流量数据的全部XDR特征变量;将所述HTTPS流量数据的全部XDR特征变量输入预先创建的支持向量机分类模型,得到所述HTTPS流量数据对应的流量类型;其中,所述流量类型为图片流量或非图片流量;所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,所述样本流量数据为已标记为图片流量和非图片流量的数据。2.根据权利要求1所述的HTTPS流量识别方法,其特征在于:所述每一XDR特征变量及其对应的计算口径如下表所示:3.根据权利要求1所述的HTTPS流量识别方法,其特征在于,所述所述支持向量机分类模型根据预先建立的样本流量数据的XDR特征变量数据预先创建,具体包括:对样本流量数据进行不放回抽样,生成训练集和测试集;对训练集中的XDR特征变量数据进行支持向量机训练,得到可用于识别图片流量和非图片流量的支持向量机分类模型。4.根据权利要求3所述的HTTPS流量识别方法,其特征在于,还包括:使用测试集中的XDR特征变量数据测试所述支持向量机分类模型的分类结果,计算分类结果的查准率、查全率和F值,对所述支持向量机分类模型的参数进行优化。5.根据权利要求1所述的HTTPS流量识别方法,其特征在于,在所述获取HTTPS流量数据之后,还包括:对所述HTTPS流量数据进行清洗,包括用“0”填补空缺值,剔除噪声数据、极大值和极小值,以及对HTTPS流量数据进行离散化处理。6.根据权利要求1所...

【专利技术属性】
技术研发人员:郑涛林宇杨傅宇彭司宇陈杰李秀海
申请(专利权)人:广东宜通世纪科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1