一种HTTPS网页的指纹识别方法技术

技术编号:11692371 阅读:98 留言:0更新日期:2015-07-08 11:41
本申请涉及一种HTTPS网页的指纹提取方法和指纹识别方法,指纹提取方法包括:根据待处理HTTPS网页的数据流,获得待处理HTTPS网页的多个对象各自的密文长度和加密方式;根据待处理HTTPS网页的多个对象各自的密文长度和加密方式,获得多个对象各自的明文长度区间,以确定每个对象的信息,其中每个对象的信息包括该对象对应的最大长度、最小长度和平均长度;以及利用待处理HTTPS网页的多个对象各自的信息,构建待处理HTTPS网页的指纹。指纹识别方法包括:通过提取待识别HTTPS网页的对象信息,与HTTPS网页指纹库中的信息进行匹配,完成识别。本发明专利技术的指纹提取方法和指纹识别方法,可行性强,识别准确率高。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体涉及一种HTTPS网页的指纹提取方法和指纹识 别方法。
技术介绍
目前,随着流量识别领域技术的发展,在网络管理方面对其的需求也越来越广泛。 人们不再局限于以往在应用层面对流量的识别,而更侧重于加密流量的识别方法,如P2P, SSL,SSH等。随着近年来SSL协议及其衍生体TLS协议的发展,HTTPS协议(HTTP协议与 SSL协议的结合体)逐渐兴起。 HTTPS是一种保证网页数据安全传输的加密协议。在HTTPS协议中,HTTP负责网 页数据的传输,SSL协议负责数据加密和身份认证。目前,HTTPS协议已经被广泛地应用到 网络银行、网络支付、电子商务等重要服务中。众多Web站点为了自身在通讯过程中的安 全,也都通过HTTPS协议来进行数据传输。即使是通常采用HTTP协议的普通网站,也会对 其用户登录和注册等涉及到网络用户私密信息的页面采用HTTPS协议进行传输,甚至为用 户提供专门的HTTPS协议通道。因此,HTTPS协议在Web通讯市场上已经占有了一席之地, HTTPS加密流量越来越广泛,且将持续增加。然而,目前针对HTTPS的加密技术的识别准确 率较低,可行性较差。
技术实现思路
本专利技术提供一种HTTPS网页的指纹提取方法和指纹识别方法,其目的是解决目前 针对基于HTTPS协议的加密网页流量的识别准确率较低的问题。 为了实现上述专利技术目的,本专利技术采取的技术方案如下: -种HTTPS网页的指纹提取方法,该指纹提取方法包括:根据待处理HTTPS网页的 数据流,获得待处理HTTPS网页的多个对象各自的密文长度和加密方式;根据待处理HTTPS 网页的多个对象各自的密文长度和加密方式,获得多个对象各自的明文长度区间,以确定 每个对象的信息,其中每个对象的信息包括该对象对应的最大长度、最小长度和平均长度; 以及利用待处理HTTPS网页的多个对象各自的信息,构建待处理HTTPS网页的指纹。 优选地,在获得多个对象各自的明文长度区间的步骤中:针对多个对象 中的每个对象,当该对象采用流加密方式时,该对象的明文长度区间为L(D)= ,当该对象采用块加密方式时,该对象的明文长度区间为 L(D) = ,其中,L(D)表示该对象的明文长度 区间,且明文长度区间内逗号左侧表达式表示该对象的最小长度,而逗号右侧表达式表示 该对象的最大程度;L(E)表示该对象的密文长度,L(Mac)表示根据该对象的加密方式所获 得的校验信息长度,n表示该对象在传输中的分片数,bs表示根据该对象的加密方式所采 取的块大小。 优选地,构建的待处理HTTPS网页的指纹为:fp={obji,i= 1,2,…,NJ, 其中,Ntl表示待处理HTTPS网页所包括的对象数量,fp表示待处理HTTPS网页的指纹,Obji={objijnin,ObjiJiiax,obji_s},ObjiJnin表示待处理HTTPS网页的第i个对象的 最小长度,ObjiJnax表示第i个对象的最大长度,obji_s表示第i个对象的平均长度,且【主权项】1. 一种HTTPS网页的指纹提取方法,其特征在于,所述指纹提取方法包括: 根据待处理HTTPS网页的数据流,获得所述待处理HTTPS网页的多个对象各自的密文 长度和加密方式; 根据所述待处理HTTPS网页的多个对象各自的密文长度和加密方式,获得所述多个对 象各自的明文长度区间,以确定每个对象的信息,其中每个对象的信息包括该对象对应的 最大长度、最小长度和平均长度;以及 利用所述待处理HTTPS网页的多个对象各自的信息,构建所述待处理HTTPS网页的指 纹。2. 根据权利要求1所述的指纹提取方法,其特征在于,在获得所述多个对象各自的明 文长度区间的步骤中: 针对所述多个对象中的每个对象, 当该对象采用流加密方式时,该对象的明文长度区间为L(D)= , 当该对象采用块加密方式时,该对象的明文长度区间为L(D) = , 其中,L(D)表示该对象的明文长度区间,且所述明文长度区间内逗号左侧表达式表示 该对象的最小长度,而逗号右侧表达式表示该对象的最大程度;L(E)表示该对象的密文长 度,L(Mac)表示根据该对象的加密方式所获得的校验信息长度,η表示该对象在传输中的 分片数,bs表示根据该对象的加密方式所采取的块大小。3. 根据权利要求1或2所述的指纹提取方法,其特征在于,构建的所述待处理HTTPS网 页的指纹为: fp = {obji, i = I, 2,. . . , N〇}, 其中,Ntl表示所述待处理HTTPS网页所包括的对象数量,fp表示所述待处理HTTPS网 页的指纹, Obji= {obj ^min, obj^max, obj^s}, ObjiJiiin表示所述待处理HTTPS网页的第i个对象的最小长度,ObjiJiiax表示所述第 i个对象的最大长度,〇bji_s表示所述第i个对象的平均长度,且4. 一种HTTPS网页的指纹识别方法,其特征在于,所述指纹识别方法包括: 捕获预定数量个未知HTTPS网页的数据流,以确定所述预定数量个未知HTTPS网页所 包括的所有未知对象的密文长度和加密方式; 根据每个未知对象的密文长度和加密方式,获得每个未知对象的明文长度区间,以确 定每个未知对象的信息,其中每个未知对象的信息包括该未知对象对应的最大长度、最小 长度和平均长度; 根据所述所有未知对象的信息,构建所述预定数量个未知HTTPS网页对应的待识别数 据集;以及 将所述待识别数据集与预定指纹库中每个已知HTTPS网页的指纹进行匹配,以根据匹 配结果来确定所述待识别数据集对应的已知HTTPS网页的指纹,作为所述待识别数据集的 指纹识别结果。5. 根据权利要求4所述的指纹识别方法,其特征在于,将所述待识别数据集与预定指 纹库中每个已知HTTPS网页的指纹进行匹配的步骤包括: 针对所述预定数量个未知HTTPS网页所包括的每个未知对象, 判定每个已知HTTPS网页的每个已知对象的明文长度区间是否与该未知对象的明文 长度区间有交集:若有交集,则将该已知对象的信息存入该已知对象所属已知HTTPS网页 对应的匹配集中, 在每个已知HTTPS网页对应的匹配集包含的所有已知对象之中确定该未知对象的匹 配对象,使得所述匹配对象的平均长度与该未知对象的平均长度之间距离最小,并将所述 匹配对象与该未知对象之间的对应关系存入所述匹配对象所属已知HTTPS网页对应的匹 配集中。6. 根据权利要求5所述的指纹识别方法,其特征在于,所述未知对象的明文长度区间 中的较小值等于所述未知对象的最小长度与预设的缓冲因子之差,而所述未知对象的明文 长度区间中的较大值等于所述未知对象的最大长度与所述缓冲因子之和。7. 根据权利要求4-6中任一项所述的指纹识别方法,其特征在于,所述根据匹配结果 来确定所述待识别数据集对应的已知HTTPS网页的指纹的步骤包括: 根据所述预定数量个未知HTTPS网页所包括的所有未知对象的个数及总字节数、所 述预定指纹库中每个已知HTTPS网页所包括的所有已知对象的个数及总字节数、每个匹配 集中所包括的所有已知对象的个数及总字节数、每个匹配集中所包括的每个对应关系本文档来自技高网...
一种HTTPS网页的指纹识别方法

【技术保护点】
一种HTTPS网页的指纹提取方法,其特征在于,所述指纹提取方法包括:根据待处理HTTPS网页的数据流,获得所述待处理HTTPS网页的多个对象各自的密文长度和加密方式;根据所述待处理HTTPS网页的多个对象各自的密文长度和加密方式,获得所述多个对象各自的明文长度区间,以确定每个对象的信息,其中每个对象的信息包括该对象对应的最大长度、最小长度和平均长度;以及利用所述待处理HTTPS网页的多个对象各自的信息,构建所述待处理HTTPS网页的指纹。

【技术特征摘要】

【专利技术属性】
技术研发人员:余翔湛何慧张伟哲叶麟张宏莉康宁丛小亮
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1