网页访问方法、装置及计算机可读存储介质、终端制造方法及图纸

技术编号:18840314 阅读:30 留言:0更新日期:2018-09-05 08:25
本发明专利技术涉及互联网领域,具体涉及一种网页访问方法、装置及计算机可读存储介质、终端,所述方法包括:接收所访问网页的网页文件,获取网页文件中预置的初始识别码;计算所述网页文件,获取网页文件的当前识别码;当所述网页文件的初始识别码与当前识别码不相同时,确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页;当所述网页文件的初始识别码与当前识别码相同时,以接收到的所述网页文件渲染出该网页。本发明专利技术通过判断网页的初始识别码与当前识别码是否相同来确认网页是否被劫持而制定不同的访问策略,既能保证网页访问安全,也保证网页访问速度,提升了整体的用户体验。

Web page access method, device, computer readable storage medium and terminal

The invention relates to the Internet field, in particular to a web page access method, a device and a computer readable storage medium and a terminal. The method comprises: receiving a web page file visited, obtaining a preset initial identification number in the web page file, calculating the web page file, and obtaining the current identification number of the web page file; When the initial identification number of the web page file is different from the current identification number, it is determined that the web page is hijacked, and the web page is requested to visit again with an HTTPS protocol link; when the initial identification number of the web page file is the same as the current identification number, the web page is rendered with the received web page file. The invention determines whether a web page is hijacked or not by judging whether the initial identification number of a web page is the same as the current identification number, and establishes different access strategies, which can ensure the security of web page access, the speed of web page access and the overall user experience.

【技术实现步骤摘要】
网页访问方法、装置及计算机可读存储介质、终端
本专利技术涉及互联网领域,具体涉及一种网页访问方法、装置及计算机可读存储介质、终端。
技术介绍
ISP,即互联网服务提供商,为网络用户提供网络接入服务,目前具有ISP资质的包括CNC(网通)、TELCOM(电信)、铁通、联通、移动、电力通(通过电力线上网)、有线通(通过有线电视上网),卫通(通过卫星上传下载数据)等等,这些互联网服务提供商虽然为网络用户的网络接入提供了便利,然而,也存在一些弊端,例如,用户所访问的网页遭受到ISP劫持,典型地,某些互联网服务提供商会在用户访问的网页中,强制性地向用户推送广告,或者,篡改用户访问网页的网页内容等。因此,如何准确、有效地判断某个网页是否被ISP劫持,并解决劫持问题,成为本领域技术人员亟需解决的一个问题,目前,行业内的解决方案是全站使用HTTPS协议,而使用HTTPS协议虽然可以大部分解决网页被劫持的问题,但是明显降低了网页的访问速度,影响用户体验。
技术实现思路
为克服以上技术问题,特别是现有技术对于网页被劫持的问题,无法平衡网页访问安全和网页访问速度的问题,特提出以下技术方案:第一方面,本专利技术提供了一种网页访问方法,包括:接收所访问网页的网页文件,获取网页文件中预置的初始识别码;计算所述网页文件,获取网页文件的当前识别码;当所述网页文件的初始识别码与当前识别码不相同时,确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页;当所述网页文件的初始识别码与当前识别码相同时,以接收到的所述网页文件渲染出该网页。进一步的,所述初始识别码为在所述网页开发过程中根据指定算法计算网页文件得到的初始识别码;所述计算所述网页文件,获取网页文件的当前识别码,包括:根据所述指定算法计算网页文件,获取网页文件的当前识别码。进一步的,所述根据所述指定算法计算网页文件,获取网页文件的当前识别码,包括:基于所述网页文件包含的标签根据所述指定算法计算出网页文件的当前识别码。进一步的,所述基于所述网页文件包含的标签根据所述指定算法计算出网页文件的当前识别码,包括:获取网页文件中<script>标签数量;获取网页文件中<img>标签数量;获取网页文件中<iframe>标签数量;确认所述<script>标签是否存在IP形式地址的外链;以所述<script>标签数量、<img>标签数量、<iframe>标签数量、确认<script>是否存在IP形式地址的外链与预定分隔符组合,作为网页文件的当前识别码。进一步的,所述接收所访问网页的网页文件,包括:以HTTP协议链接接收所访问网页的网页文件。进一步的,所述确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页,包括:确定所述网页被劫持,使用302重定向跳转到HTTPS链接再次请求访问该网页。可选的,所述计算所述网页文件,获取网页文件的当前识别码,包括:计算网页文件的MD5值,作为网页文件的当前识别码;或计算网页文件对应的网页的content-length,作为网页文件的当前识别码;或计算网页文件对应的哈希值,作为网页文件的当前识别码。进一步的,所述确定所述网页被劫持之后,还包括:将所述网页被劫持的信息上报到记录服务器。第二方面,本专利技术还提供一种网页访问装置,包括:获取模块:用于接收所访问网页的网页文件,获取网页文件中预置的初始识别码;计算模块:用于计算所述网页文件,获取网页文件的当前识别码;第一执行模块:用于当所述网页文件的初始识别码与当前识别码不相同时,确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页;第二执行模块:用于当所述网页文件的初始识别码与当前识别码相同时,以接收到的所述网页文件渲染出该网页。第三方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的网页访问方法。第四方面,本专利技术还提供了一种终端,所述终端包括一个或多个处理器、存储器、一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的网页访问方法。本专利技术与现有技术相比,具有以下有益效果:本专利技术通过获取所访问网页的初始识别码与当前识别码,并判断所述初始识别码与当前识别码是否相同来确认网页是否被劫持而制定不同的访问策略,当网页被劫持时跳转至以安全通道的HTTPS协议再次请求访问该网页,保证网页的安全访问,当网页未被劫持时,根据接收到的网页文件快速渲染出网页页面,提高网页的访问速度,既能保证网页访问安全,也保证网页访问速度,提升了整体的用户体验。此外,本专利技术首先提供给用户的还是HTTP链接,但在页面加载完后会自动检测是否有被劫持,有劫持则跳转到HTTPS下浏览,否则正常访问,而劫持问题是小概率事件,通过算法实时判断网页是否被劫持,来把用户区分成两类,有被劫持和没被劫持,让HTTPS的性能问题只影响被劫持的那少部分用户,避免了因为小概率的劫持问题而导致全量用户访问速度变慢的问题,提升了整体的用户体验。再者,本专利技术还将网页被劫持的信息上报到记录服务器,为分析网页被劫持发生的原因、劫持的源头、劫持手段进行记录,分析人员便可针对不同的原因指定相应的策略应对,降低网页被劫持的概率,进而提高网页的访问速度。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术网页访问方法的一实施例流程示意图;图2为本专利技术网页访问方法的另一实施例流程示意图;图3为本专利技术计算网页文件的当前识别码的一实施例流程示意图;图4为本专利技术网页访问装置的一实施例示意图;图5为本专利技术终端的一实施例结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。本领域技术人员应当理解,本专利技术所称的“应用”、“应用程序”、“应用软件”、“客户端”、“客户端软件”以及类似表述的概念,是业内技术人员所公知的相本文档来自技高网
...

【技术保护点】
1.一种网页访问方法,其特征在于,包括:接收所访问网页的网页文件,获取网页文件中预置的初始识别码;计算所述网页文件,获取网页文件的当前识别码;当所述网页文件的初始识别码与当前识别码不相同时,确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页;当所述网页文件的初始识别码与当前识别码相同时,以接收到的所述网页文件渲染出该网页。

【技术特征摘要】
1.一种网页访问方法,其特征在于,包括:接收所访问网页的网页文件,获取网页文件中预置的初始识别码;计算所述网页文件,获取网页文件的当前识别码;当所述网页文件的初始识别码与当前识别码不相同时,确定所述网页被劫持,以HTTPS协议链接再次请求访问该网页;当所述网页文件的初始识别码与当前识别码相同时,以接收到的所述网页文件渲染出该网页。2.根据权利要求1所述的方法,其特征在于,所述初始识别码为在所述网页开发过程中根据指定算法计算网页文件得到的初始识别码;所述计算所述网页文件,获取网页文件的当前识别码,包括:根据所述指定算法计算网页文件,获取网页文件的当前识别码。3.根据权利要求2所述的方法,其特征在于,所述根据所述指定算法计算网页文件,获取网页文件的当前识别码,包括:基于所述网页文件包含的标签根据所述指定算法计算出网页文件的当前识别码。4.根据权利要求3所述的方法,其特征在于,所述基于所述网页文件包含的标签根据所述指定算法计算出网页文件的当前识别码,包括:获取网页文件中<script>标签数量;获取网页文件中<img>标签数量;获取网页文件中<iframe>标签数量;确认所述<script>标签是否存在IP形式地址的外链;以所述<script>标签数量、<img>标签数量、<iframe>标签数量、确认<script>是否存在IP形式地址的外链与预定分隔符组合,作为网页文件的当前识别码。5.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:陈精任
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1