网页资源的拦截方法及装置制造方法及图纸

技术编号:20978813 阅读:31 留言:0更新日期:2019-04-29 18:43
本申请实施例公开了一种网页资源的拦截方法及装置,用以实现个性化地对网页资源进行拦截的效果。所述方法包括:响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;获取预设的资源拦截规则库,资源拦截规则库中包括各访问者类型和与各访问者类型分别对应的资源拦截规则之间的对应关系;根据所述对应关系,获取第一访问者类型所对应的第一资源拦截规则;将第一访问者类型所对应的第一资源拦截规则下发至所述客户端。该技术方案从根本上解决了规则数量过多所引起的内存问题,且保证了资源过滤的准确性。

Interception Method and Device of Web Page Resources

The embodiment of this application discloses a method and device for intercepting web page resources to achieve the effect of personalized interception of web page resources. The method includes: in response to a client's access request to the first web page, determining the first visitor type corresponding to the access request according to the relevant access information of the access request; dividing the visitors according to the specified visitor partition granularity; acquiring the preset resource interception rule base and the resource interception rule base. It includes the corresponding relationship between each visitor type and the corresponding resource interception rules for each visitor type; according to the corresponding relationship, the first resource interception rule corresponding to the first visitor type is obtained; and the first resource interception rule corresponding to the first visitor type is sent to the client. This technical scheme fundamentally solves the memory problem caused by too many rules, and ensures the accuracy of resource filtering.

【技术实现步骤摘要】
网页资源的拦截方法及装置
本专利技术涉及数据处理
,尤其涉及一种网页资源的拦截方法及装置。
技术介绍
目前的广告拦截有两种方法,一种是基于域名字符串的广告拦截规则对广告进行拦截,即,浏览器使用广告拦截规则判断某个资源是否为广告时,只需判断是否有广告拦截规则和资源url(UniformResourceLocator,统一资源定位符)的域名匹配即可;若有广告拦截规则和资源url的域名匹配,则说明该资源为广告。这种方法匹配速度快、占用内存低,缺点在于广告拦截规则太过简单,导致很多广告拦截不到。另一种是按照Adblockplus制定的规则规范来写的广告拦截规则,由于这种方法制定的广告拦截规则复杂而繁多,因此浏览器采用这种广告拦截规则拦截广告会更精准、匹配速度快,但缺点在于占用内存太高。
技术实现思路
本申请实施例的目的是提供一种网页资源的拦截方法及装置,用以实现个性化地对网页资源进行拦截的效果。为解决上述技术问题,本申请实施例是这样实现的:一方面,本申请实施例提供一种网页资源的拦截方法,应用于服务器端,包括:响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。在一个实施例中,所述响应于接收到客户端对第一网页的访问请求之前,所述方法还包括:根据所述访问者划分粒度,确定多个访问者类型;根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。在一个实施例中,所述根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则,包括:获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。在一个实施例中,所述根据所述规则使用信息,分别对所述初始拦截规则进行过滤,包括:根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。在一个实施例中,所述根据所述规则使用信息,对所述初始拦截规则进行过滤,还包括:按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。在一个实施例中,所述方法还包括:将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。在一个实施例中,在对所述第一网页进行资源过滤之后,所述方法还包括:对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;若否,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。在一个实施例中,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;所述将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,包括:将所述第一访问者类型对应的国家所对应的第一资源拦截规则下发至所述客户端。另一方面,本申请实施例提供一种网页资源的拦截装置,应用于服务器端,包括:第一确定模块,用于响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;第一获取模块,用于获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;第二获取模块,用于根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;下发模块,用于将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。在一个实施例中,所述装置还包括:第二确定模块,用于在响应于接收到客户端对第一网页的访问请求之前,根据所述访问者划分粒度,确定多个访问者类型;第三确定模块,用于根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;第一生成模块,用于分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。在一个实施例中,所述第三确定模块包括:获取单元,用于获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;确定单元,用于利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;过滤单元,用于根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。在一个实施例中,所述过滤单元还用于:根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。在一个实施例中,所述过滤单元还用于:按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;从排序后的多个所本文档来自技高网...

【技术保护点】
1.一种网页资源的拦截方法,其特征在于,应用于服务器端,所述方法包括:响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。

【技术特征摘要】
1.一种网页资源的拦截方法,其特征在于,应用于服务器端,所述方法包括:响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。2.根据权利要求1所述的方法,其特征在于,所述响应于接收到客户端对第一网页的访问请求之前,所述方法还包括:根据所述访问者划分粒度,确定多个访问者类型;根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。3.根据权利要求2所述的方法,其特征在于,所述根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则,包括:获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。4.根据权利要求3所述的方法,其特征在于,所述根据所述规则使用信息,分别对所述初始拦截规则进行过滤,包括:根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。5.根据权利要求4所述的方法,其特征在于,所述根据所述规则使用信息,对所述初始拦截规则进行过滤,还包括:按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。6.根据权利要求2-5中任一项所述的方法,其特征在于,所述方法还包括:将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。7.根据权利要求1所述的方法,其特征在于,在对所述第一网页进行资源过滤之后,所述方法还包括:对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;若否,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。8.根据权利要求1所述的方法,其特征在于,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;所述将所述第一访...

【专利技术属性】
技术研发人员:李永才李涛
申请(专利权)人:麒麟合盛网络技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1