网页的访问控制方法及装置制造方法及图纸

技术编号:19327855 阅读:23 留言:0更新日期:2018-11-03 14:42
本公开是关于一种网页的访问控制方法及装置。该方法包括:获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;在客户端访问的网页的域名对应的网站中抓取网页;将抓取的网页中引用的资源的域名确定为安全域名;将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名;从候选域名中确定非安全域名;根据非安全域名生成禁止访问规则,其中,禁止访问规则用于指示客户端禁止加载非安全域名下的资源;将禁止访问规则发送至客户端。本公开能够发现网页中篡改插入的资源的域名,并通过禁止访问规则指示客户端禁止加载非安全域名下的资源,且不依赖于网站,可控性较强,不需要搭建代理服务器,成本较低。

Access control method and device for webpage

The present disclosure relates to a web page access control method and device. The method includes: acquiring the domain name of the web page accessed by the client and the domain name of the resource referenced in the web page accessed by the client; crawling the web page in the corresponding web site of the domain name of the web page accessed by the client; determining the domain name of the resource referenced in the crawled Web page as the secure domain name; and referring to the web page accessed by the client. The domain names of resources except secure domain names are identified as candidate domain names; the non-secure domain names are determined from the candidate domain names; the access prohibition rules are generated according to the non-secure domain names, in which the access prohibition rules are used to instruct the client to prohibit the loading of resources under the non-secure domain names; and the access prohibition rules are sent to the client. This disclosure can discover the domain name of the inserted resource in the web page and instruct the client to prohibit the loading of resources under the non-secure domain name by the prohibition access rule, which is independent of the website, highly controllable, does not need to build a proxy server, and has low cost.

【技术实现步骤摘要】
网页的访问控制方法及装置
本公开涉及互联网
,尤其涉及网页的访问控制方法及装置。
技术介绍
应用(App,Application)加载网页时,如果使用未经加密的HTTP(HyperTextTransferProtocol,超文本传输协议)传输,则页面内容对于传输过程中的中间节点是可见的。攻击者可以利用这一点篡改页面内容以获得利益。目前常见的篡改手段是在页面中插入外链的脚本代码或图片,弹出浮动广告。页面内容被篡改会干扰用户的正常浏览,甚至造成用户的经济损失。为了进行网页的访问控制,相关技术通常将网站切换为支持加密传输,在明文传输的基础上引入TLS(TransportLayerSecurity,安全传输层协议),即采用HTTPS(HyperTextTransferProtocoloverSecureSocketLayer,基于安全套接字层的超文本传输协议),避免传输过程的中间节点获知传输内容,从而能够避免传输内容被篡改。这种方式依赖于网站的修改。切换为加密传输的成本较高,中小企业往往不愿意承担,且应用(如浏览器)的提供方无法对传输协议进行控制。另一种相关技术是由应用提供方搭建代理服务器,将所有传输都由代理服务器中转,从代理服务器到客户端采取加密传输。这种方式需要应用提供方付出较高的成本,并且同时需要采取措施保证源网站对应的源服务器到代理服务器的传输安全。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种网页的访问控制方法及装置。根据本公开实施例的第一方面,提供一种网页的访问控制方法,包括:获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;在客户端访问的网页的域名对应的网站中抓取网页;将抓取的网页中引用的资源的域名确定为安全域名;将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名;从候选域名中确定非安全域名;根据非安全域名生成禁止访问规则,其中,所述禁止访问规则用于指示客户端禁止加载非安全域名下的资源;将所述禁止访问规则发送至客户端。在一种可能的实现方式中,从候选域名中确定非安全域名,包括:对候选域名对应的访问量进行排序,得到排序结果;根据所述排序结果确定非安全域名。在一种可能的实现方式中,根据所述排序结果确定非安全域名,包括:将所述排序结果中被选择的域名确定为非安全域名。在一种可能的实现方式中,根据所述排序结果确定非安全域名,包括:将所述排序结果中排序在前的N个域名确定为非安全域名,其中,所述排序结果按照候选域名对应的访问量由高到低的顺序进行排序,N为正整数。在一种可能的实现方式中,在客户端访问的网页的域名对应的网站中抓取网页,包括:根据客户端访问的网页的域名,对客户端访问的网页进行聚类,确定客户端访问的网页的域名对应的网站中被客户端访问的网页;抓取客户端访问的网页的域名对应的网站中被客户端访问的网页。在一种可能的实现方式中,获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名,包括:接收客户端以指定频率上传的所述客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名。根据本公开实施例的第二方面,提供一种网页的访问控制装置,包括:获取模块,用于获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;抓取模块,用于在客户端访问的网页的域名对应的网站中抓取网页;第一确定模块,用于将抓取的网页中引用的资源的域名确定为安全域名;第二确定模块,用于将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名;第三确定模块,用于从候选域名中确定非安全域名;生成模块,用于根据非安全域名生成禁止访问规则,其中,所述禁止访问规则用于指示客户端禁止加载非安全域名下的资源;发送模块,用于将所述禁止访问规则发送至客户端。在一种可能的实现方式中,所述第三确定模块包括:排序子模块,用于对候选域名对应的访问量进行排序,得到排序结果;确定子模块,用于根据所述排序结果确定非安全域名。在一种可能的实现方式中,所述确定子模块用于:将所述排序结果中被选择的域名确定为非安全域名。在一种可能的实现方式中,所述确定子模块用于:将所述排序结果中排序在前的N个域名确定为非安全域名,其中,所述排序结果按照候选域名对应的访问量由高到低的顺序进行排序,N为正整数。在一种可能的实现方式中,所述抓取模块包括:聚类子模块,用于根据客户端访问的网页的域名,对客户端访问的网页进行聚类,确定客户端访问的网页的域名对应的网站中被客户端访问的网页;抓取子模块,用于抓取客户端访问的网页的域名对应的网站中被客户端访问的网页。在一种可能的实现方式中,所述获取模块用于:接收客户端以指定频率上传的所述客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名。根据本公开实施例的第三方面,提供一种网页的访问控制装置,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述方法。本公开的实施例提供的技术方案可以包括以下有益效果:通过获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名,在客户端访问的网页的域名对应的网站中抓取网页,将抓取的网页中引用的资源的域名确定为安全域名,将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名,从候选域名中确定非安全域名,根据非安全域名生成禁止访问规则,并将禁止访问规则发送至客户端,由此能够借助客户端的实际访问数据发现网页中篡改插入的资源的域名,并通过禁止访问规则指示客户端禁止加载非安全域名下的资源,且不依赖于网站,可控性较强,不需要搭建代理服务器,成本较低。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种网页的访问控制方法的流程图。图2是根据一示例性实施例示出的一种网页的访问控制方法步骤S15的一示例性的流程图。图3是根据一示例性实施例示出的一种网页的访问控制方法步骤S12的一示例性的流程图。图4是根据一示例性实施例示出的一种网页的访问控制装置的框图。图5是根据一示例性实施例示出的一种网页的访问控制装置的框图。图6是根据一示例性实施例示出的一种用于网页的访问控制装置的装置1900的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种网页的访问控制方法的流程图。该方法可以应用于服务器中。例如,该方法可以应用于浏览器的服务器中。如图1所示,该方法包括步骤S11至步骤S17。在步骤S11中,获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名。在本实施例中,客户本文档来自技高网...

【技术保护点】
1.一种网页的访问控制方法,其特征在于,包括:获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;在客户端访问的网页的域名对应的网站中抓取网页;将抓取的网页中引用的资源的域名确定为安全域名;将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名;从候选域名中确定非安全域名;根据非安全域名生成禁止访问规则,其中,所述禁止访问规则用于指示客户端禁止加载非安全域名下的资源;将所述禁止访问规则发送至客户端。

【技术特征摘要】
1.一种网页的访问控制方法,其特征在于,包括:获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;在客户端访问的网页的域名对应的网站中抓取网页;将抓取的网页中引用的资源的域名确定为安全域名;将客户端访问的网页中引用的资源的域名中除了安全域名以外的域名确定为候选域名;从候选域名中确定非安全域名;根据非安全域名生成禁止访问规则,其中,所述禁止访问规则用于指示客户端禁止加载非安全域名下的资源;将所述禁止访问规则发送至客户端。2.根据权利要求1所述的方法,其特征在于,从候选域名中确定非安全域名,包括:对候选域名对应的访问量进行排序,得到排序结果;根据所述排序结果确定非安全域名。3.根据权利要求2所述的方法,其特征在于,根据所述排序结果确定非安全域名,包括:将所述排序结果中被选择的域名确定为非安全域名。4.根据权利要求2所述的方法,其特征在于,根据所述排序结果确定非安全域名,包括:将所述排序结果中排序在前的N个域名确定为非安全域名,其中,所述排序结果按照候选域名对应的访问量由高到低的顺序进行排序,N为正整数。5.根据权利要求1所述的方法,其特征在于,在客户端访问的网页的域名对应的网站中抓取网页,包括:根据客户端访问的网页的域名,对客户端访问的网页进行聚类,确定客户端访问的网页的域名对应的网站中被客户端访问的网页;抓取客户端访问的网页的域名对应的网站中被客户端访问的网页。6.根据权利要求1所述的方法,其特征在于,获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名,包括:接收客户端以指定频率上传的所述客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名。7.一种网页的访问控制装置,其特征在于,包括:获取模块,用于获取客户端访问的网页的域名,以及客户端访问的网页中引用的资源的域名;抓取模块,用于在客户端访问的网页的...

【专利技术属性】
技术研发人员:於一飞左景龙
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1