当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于对象属性的Web页面请求方法技术

技术编号:23085273 阅读:22 留言:0更新日期:2020-01-11 01:13
本发明专利技术公开了一种基于对象属性的Web页面请求方法,对Web页面中的每个对象,依据其Class属性值选择HTTP或HTTPS的方式向服务器发起请求,具体为:如果其Class属性值在黑名单上或与黑名单上的任一Class属性值的相似度大于等于给定阈值,则判断其Src属性值的头部是否为HTTP,是则将HTTP替换成HTTPS;如果其Class属性值不在黑名单上且与黑名单对象的相似度小于等于给定阈值,则判断其Src属性值的头部是否为HTTPS,是则将HTTPS替换成HTTP。对Web页面中的每个对象,根据其Src属性值的头部内容确定请求方式。本发明专利技术可以优化Web页面加载时间,使网络带宽得以充分利用。

A web page request method based on object properties

【技术实现步骤摘要】
一种基于对象属性的Web页面请求方法
本专利技术涉及一种基于对象属性的Web页面请求方法。
技术介绍
伴随着前端H5、NODEJS、VUE等技术的兴起,网页样式变得越来越复杂多样、内容也越来越丰富多彩,网页加载时间因各类资源的加载而变长。Web页面加载时间(PageLoadTime,PLT)影响着用户体验,故成为了一个网站关键的性能指标。因此,Web页面加速技术研究逐渐成为了计算机网络领域的热点。针对加载Web页面过程中,对象加载时间开销过大的问题,需要提供一种能够提高Web页面加载速度,缩短Web页面加载时间的Web页面请求方法。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于对象属性的Web页面请求方法,能够提高Web页面加载速度,缩短Web页面加载时间。本专利技术提供的技术方案为:一种基于对象属性的Web页面请求方法,包括以下步骤:步骤1、初始化黑名单,其包括各种涉及用户隐私的对象的Class(类型)属性值;初始化相似度阈值;步骤2、对于Web页面中的每一个对象,先判断其Class属性值是否在黑名单上,若是,则采用HTTPS的形式请求该对象;否则,继续判断其Class属性值与黑名单上各个Class属性值的相似度,如果其Class属性值与黑名单上任意一个Class属性值的相似度大于相似度阈值,则采用HTTPS的形式请求该对象,否则采用HTTP的形式请求该对象。进一步地,采用WordNet计算两个Class属性值的相似度;设两个Class属性值分别为WordNet中的结点c1和c2,它们的相似度similarity(c1,c2)计算公式为:其中,IC(CMICA)表示结点c1和c2的所有公共父结点中信息量最大的父结点的信息量,Distance(c1,c2)表示结点c1和c2之间的距离(跳数),Depthmax表示WordNet的最大深度;WordNet中结点c的信息量IC(c)计算公式为:其中,Nodemax表示存在于WordNet中的所有结点的总数,hypo(c)为结点c在WordNet中的子结点(下位词)的总数。进一步地,所述步骤1中,初始化相似度阈值为0.9。进一步地,所述步骤1中,初始化黑名单中包括以下Class属性值:user、avatar、photo、login、img-*、img_*、face、qrcode和qr。进一步地,所述步骤2中,采用HTTPS的形式请求该对象的具体步骤为:先判断该对象的Src(源文件地址)属性值头部是否为HTTPS,若是,则该对象的Src属性值头部保持不变,否则,将该对象的Src属性值头部替换成HTTPS;然后针对该对象,生成相应的HTTPS并向服务器发送,以请求加载该对象。进一步地,所述步骤2中,采用HTTP的形式请求该对象的具体步骤为:先判断该对象的Src属性值头部是否为HTTP,若是,则该对象的Src属性值头部保持不变,否则,将该对象的Src属性值头部替换成HTTP;然后针对该对象,生成相应的HTTP并向服务器发送,以请求加载该对象。本专利技术技术构思说明:浏览器通过HTTP或者HTTPS的方式与服务器通信获取Web页面对象。HTTPS是在HTTP的基础上先建立TLS握手后再通过加密HTTP的方式获取对象。TLS握手虽然能够保证数据的隐私安全,但是会使页面的加载时间增加近50%。其原因在于,TLS握手次数过多增加了时间开销,使得TLS握手时间远大于下载时间。例如:获取网页中一个对象的一次完整TLS握手需要200ms,而对象下载只需要10ms。然而,在网页开发过程中,开发者通常以相对路径的格式书写Web对象的获取路径。当用户访问网页的域名方式为HTTPS,则所有以相对路径格式书写的对象都会以HTTPS的形式请求并加载,易增加不必要的TLS握手时间。针对这个问题,本专利技术以对象的Class属性值为依据区分网页对象,然后为网页对象选择合理的加载方式,避免不必要的TLS握手,以减少网页加载时间。例如:网页Logo、横幅图Banner等隐私不敏感的对象采用HTTP的形式请求并加载,而涉及用户隐私的对象则采用HTTPS的形式请求并加载。另外,开发者通常对Class属性值的命名具有一定的规范性和相似性。例如:涉及用户数据方面的对象开发者会将Class属性值命名为user或者customer,它们以不同的单词表达了相同的含义。为了能够更加准确地区分网页对象的加载方式,需要判定Class属性值命名之间的相似度,以确定是否为同一可加速对象。目前,基本的单词间相似度判断是基于普林斯顿大学认识科学实验室提出的WordNet。WordNet是一个覆盖范围宽广的英语词汇语义网。在WordNet中,名词、动词、形容词和副词分别被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间存在各种连接关系。Lin方法是最常见的基于WordNet的相似度计算方法。Lin方法认为衡量相似度的大小取决于结点自身的IC值(信息量)大小和它们祖先结点的IC值大小。由于Lin方法只考虑了IC值的计算,很容易发生误判的问题。本专利技术结合结点的IC值和结点之间的距离计算相似度,提升了Class属性值相似度计算结果的精准度。有益效果:本专利技术针对加载Web页面过程中,对象加载时间开销过大的问题,提供了一种基于对象属性的Web页面请求方法,对Web页面中的每个对象,依据其Class属性值选择HTTP或HTTPS的方式向服务器发起请求,具体为:如果其Class属性值在黑名单上或与黑名单上的任一Class属性值的相似度大于等于给定阈值,则判断其Src属性值的头部是否为HTTP,是则将HTTP替换成HTTPS;如果其Class属性值不在黑名单上且与黑名单对象的相似度小于等于给定阈值,则判断其Src属性值的头部是否为HTTPS,是则将HTTPS替换成HTTP。对Web页面中的每个对象,根据其Src属性值的头部内容确定请求方式,即若对象Src属性值的头部为HTTP,则生成相应的HTTP请求,若对象Src属性值的头部为HTTPS,则生成相应的HTTPS请求,然后向服务器发送本专利技术在Web页面中每次请求对象时,以对象的Class属性为依据区分网页对象,然后为网页对象选择合理的加载方式;将对象进行区分,减少不必要的TLS握手以达到减少网页加载时间的目的。本专利技术可以优化Web页面加载时间,使网络带宽得以充分利用,提高用户体验感。附图说明图1为本专利技术实施例的流程图。图2为本专利技术实施例测试场景拓扑图。图3为本专利技术实施例采用的WordNet分类树实例图。图4为不同网络时延变化场景下的网页加载性能测试图。其中,4(a)为网页加载时间随延迟变化示意图,4(b)为平均首字节到达时间随延迟变化示意图。本专利技术命名为HTTPS+。图5为都为小对象的网页中,可加速对象占比变化场景下网页加载性能测试图。其中,5(a)为网页加载时间随加速对象占比变化示意图,5(b)为平本文档来自技高网...

【技术保护点】
1.一种基于对象属性的Web页面请求方法,其特征在于,包括以下步骤:/n步骤1、初始化黑名单,其包括各种涉及用户隐私的对象的Class属性值;初始化相似度阈值;/n步骤2、对于Web页面中的每一个对象,先判断其Class属性值是否在黑名单上,若是,则采用HTTPS的形式请求该对象;否则,继续判断其Class属性值与黑名单上各个Class属性值的相似度,如果其Class属性值与黑名单上任意一个Class属性值的相似度大于相似度阈值,则采用HTTPS的形式请求该对象,否则采用HTTP的形式请求该对象。/n

【技术特征摘要】
1.一种基于对象属性的Web页面请求方法,其特征在于,包括以下步骤:
步骤1、初始化黑名单,其包括各种涉及用户隐私的对象的Class属性值;初始化相似度阈值;
步骤2、对于Web页面中的每一个对象,先判断其Class属性值是否在黑名单上,若是,则采用HTTPS的形式请求该对象;否则,继续判断其Class属性值与黑名单上各个Class属性值的相似度,如果其Class属性值与黑名单上任意一个Class属性值的相似度大于相似度阈值,则采用HTTPS的形式请求该对象,否则采用HTTP的形式请求该对象。


2.根据权利要求1所述的基于对象属性的Web页面请求方法,其特征在于,采用WordNet计算两个Class属性值的相似度;设两个Class属性值分别为WordNet中的结点c1和c2,它们的相似度similarity(c1,c2)计算公式为:



其中,IC(CMICA)表示结点c1和c2的所有公共父结点中信息量最大的父结点的信息量,Distance(c1,c2)表示结点c1和c2之间的距离,Depthmax表示WordNet的最大深度;WordNet中结点c的信息量IC(c)计算公式为:



其中,Nodemax表示存在于WordNet中的所有结点的总数,hypo(c)为结点c在W...

【专利技术属性】
技术研发人员:黄家玮李远洋朱海涛王建新
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1