页面资源过滤方法、装置和客户端设备制造方法及图纸

技术编号:17265240 阅读:17 留言:0更新日期:2018-02-14 12:40
本发明专利技术提供了一种页面资源过滤方法、装置和客户端设备。所述方法包括:基于用户针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中所述页面资源是所述目标页面上按照预定识别规则识别出的可视资源区域;和在显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。进一步地,可以根据被屏蔽的可视资源区域制定过滤规则,以应用后续页面显示。另外,提取的过滤规则可以进一步用于本机浏览器、服务器端、或由服务器端下发的其他浏览器的自动页面过滤。由此,能够为用户提供简便自主的页面过滤功能,提升用户浏览体验。

Page resource filtering methods, devices, and client devices

The invention provides a page resource filtering method, device and client device. The method comprises the following steps: user selection for one or more pages of resources based on the target page, the page to determine the need for filtering resources, wherein the page resource is the target page according to the regional visual resource reservation identification rules identified; and in the display of the target page, regional visual resource needs determination of shielding filter. Further, filtering rules can be formulated according to the screened visual resource area to apply the subsequent page display. In addition, the extracted filtering rules can be further applied to the automatic page filtering of other browsers on the local browser, server side, or server side. Thus, it can provide users with a simple and independent page filtering function to improve the user's browsing experience.

【技术实现步骤摘要】
页面资源过滤方法、装置和客户端设备
本专利技术涉及网页处理,尤其涉及一种页面资源过滤方法、装置以及相应的客户端设备。
技术介绍
随着互联网的兴起和发展,特别是智能移动终端的普及,人们花在网页浏览上的时间也越来越多。用户浏览网页时,通常只关注自己感兴趣的部分。为了提升用户的浏览体验,现有技术通常会对页面内容进行过滤。常用的过滤技术包括广告过滤及转码技术。广告过滤使用由官方或者民间维护的规则库进行。浏览器可以通过更新规则库来同步功能更新。虽然部分浏览器(例如,Firefox)提供了让用户进行规则调整的功能,但这些功能仅用于滤除特定的站点,并且设置起来相当复杂。另外,上述规则库主要针对用于PC显示的页面,用于移动终端页面过滤的规则较少。主要用于移动终端的转码技术当前主要由服务端应用提供。换句话说,页面的抽取策略及布局由服务提供商决定,用户无法按照自己的喜好来决定最终转码页面的信息组合或者布局。因此,需要一种新的页面过滤方案,能够方便地实现用户自定义的页面滤除,由此实现页面浏览,尤其是移动端页面浏览的个性化定制。
技术实现思路
为了解决上述的至少一个问题,本专利技术提出了一种新的页面过滤方案。该方案根据用户对事先自动划分的可视区域做出的选择进行页面屏蔽。进一步地,该方案还可将用户的在前选择用于后续页面的过滤。这样,用户能够方便灵活地屏蔽页面上的无关或是不感兴趣的资源,由此为用户的页面浏览提供更多的交互性和主动性。根据本专利技术的一个方面,提出了一种页面资源过滤方法,包括:基于用户针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中页面资源是目标页面上按照预定识别规则识别出的可视资源区域;以及在显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。这样,通过将页面过滤转换为用户对特定区域的简单选择,实现了方便灵活的页面浏览用户定制。优选地,按照预定识别规则识别可视资源区域可以包括:寻找当前页面DOM树上点击后产生对非当前页面的页面访问的衍生访问节点;以及以包含所述衍生访问节点的节点树结构作为一个可视资源区域。通过将可视页面区域限定为包括外链的节点树结构,进一步细化了对用户可选区域的限定,由此方便用户选择不必要的区域加以滤除。优选地,节点树结构可以以层级上最接近所述衍生访问节点的上级div节点作为祖先节点。通过将可视资源区域的祖先节点限定为div节点,能够更恰当地限定供用户选择的资源块。优选地,按照预定识别规则识别可视资源区域还包括:将目标页面中的主题内容排除在可视资源区域之外。由于用户通常不会将页面的主题内容滤除(例如,用户不会访问在线小说站点却将小说阅读链接滤除),因此,将核主题内容排除在滤除可选项之外,能够减少处理内容,并且避免用户将核心内容删除的误操作。优选地,所述页面过滤方法还可以包括:根据被用户选择滤除的可视资源区域制定页面过滤规则;以及对后续页面中符合所述页面过滤规则的可视页面区域进行屏蔽。由此,用户对当前页面的选择性滤除就能够应用到随后的页面处理中,从而减少用户不必要地重复性操作。优选地,所述页面过滤方法还可以包括:在用户选择所述可视资源区域之前,确定是否需要应用已有页面过滤规则,并对目标页面中符合所述已有页面过滤规则的可视页面区域做出屏蔽。这样就可以方便地实现过滤规则的叠加。优选地,根据被用户选择滤除的可视资源区域制定页面过滤规则包括:提取被屏蔽的可视资源区域在目标网页中的位置特征和/或层次特征;以及根据所述位置特征和/或所述层次特征制定页面过滤规则。这样,就可以例如根据被屏蔽区域在目标页面中的位置特征和/或层次特征,滤除实施过滤规则的后续页面中具有相同或相应特征的资源区域。优选地,所述可视资源区域可以对应于前述具有外链特征的节点树结构。优选地,该节点树结构同样具有祖先div节点。这样,位置特征就可以是节点树结构的祖先节点在当前页面DOM树中的XPath位置,而层次特征是祖先节点到衍生访问节点的XPath路径。由此,就能更为方便准确地找到后续页面中符合滤除规则的资源区域加以滤除。优选地,根据被用户选择滤除的可视资源区域制定页面过滤规则还包括:提取可视资源区域被屏蔽的目标网页的域名信息;以及针对具有相同域名信息的后续页面应用所述页面过滤规则。由于相同域名的页面通常具有相同的显示布局,因此实现对过滤规则的恰当应用。优选地,屏蔽需要滤除的页面资源包括:将需要滤除的节点树结构的祖先节点的显示属性设为“None”;或者把所述祖先节点及其子孙节点从所述页面的DOM树删除。由此提供了可以根据实际应用情况而加以选择的屏蔽的具体实现。根据本专利技术的另一专利技术,提出了一种页面资源自动过滤方法,包括:获取如前述的页面资源过滤方法所制定的页面过滤规则;利用获取的页面过滤规则,自动修正页面资源过滤模型。这样,就能够汇总用于用户个人定制的过滤规则,以使得例如本机、服务器端或是其他客户端自动实施的页面过滤或是转码更符合广大个人用户的实际需求。优选地,利用获取的页面过滤规则,自动修正页面资源过滤模型包括:从获取的页面过滤规则中提取外链链接;以及自动滤除待处理页面中包括所述外链链接的可视资源区域。由此通过实际用户的选择更加智能地滤除不需要的外链(例如,广告或是垃圾资源)。根据本专利技术的再一个专利技术,提出了一种页面资源过滤装置,包括:滤除资源确定单元,用于基于用户针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中所述页面资源是所述目标页面上按照预定识别规则识别出的可视资源区域;和滤除资源屏蔽单元,用于在显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。优选地,所述页面资源过滤装置还可以包括:用于按照预定识别规则识别可视资源区域的资源识别单元,所述资源识别单元:寻找当前页面DOM树上点击后产生对非当前页面的页面访问的衍生访问节点;以包含所述衍生访问节点的节点树结构作为一个可视资源区域。优选地,所述节点树结构以层级上最接近所述衍生访问节点的上级div节点作为祖先节点。优选地,所述页面资源过滤装置还可以包括:过滤规则制定单元,用于根据被用户选择滤除的可视资源区域制定页面过滤规则;并且所述滤除资源屏蔽单元还对后续页面中符合所述页面过滤规则的可视页面区域进行屏蔽。优选地,所述页面资源过滤装置还可以包括:过滤规则确定单元,用于在用户选择所述可视资源区域之前,确定是否需要应用已有页面过滤规则;并且所述滤除资源屏蔽单元还对目标页面中符合所述已有页面过滤规则的可视页面区域做出屏蔽。根据本专利技术的又一个方面,提出了一种页面资源自动过滤装置,包括:过滤规则获取单元,用于获取前述的页面资源过滤装置所制定的页面过滤规则;以及页面资源修正单元,用于利用获取的页面过滤规则,自动修正页面资源过滤模型。根据本专利技术的另一个方面,提出了一种客户端设备,包括:输入装置,用于接收用户指令;显示装置,用于向用户显示信息;存储器,用于存储信息;处理器,连接至所述输入装置、显示装置和存储器,用于:基于用户通过输入装置针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中所述页面资源是所述目标页面上按照预定识别规则识别出的可视资源区域;和在所述显示装置上显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。这样,就提供了能够允许用户方便进行本文档来自技高网...
页面资源过滤方法、装置和客户端设备

【技术保护点】
一种页面资源过滤方法,包括:基于用户针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中所述页面资源是所述目标页面上按照预定识别规则识别出的可视资源区域;以及在显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。

【技术特征摘要】
1.一种页面资源过滤方法,包括:基于用户针对目标页面中的一个或多个页面资源的选择,确定需要滤除的页面资源,其中所述页面资源是所述目标页面上按照预定识别规则识别出的可视资源区域;以及在显示所述目标页面时,屏蔽确定需要滤除的可视资源区域。2.如权利要求1所述的方法,其中,按照预定识别规则识别可视资源区域包括:寻找当前页面DOM树上点击后产生对非当前页面的页面访问的衍生访问节点;以及以包含所述衍生访问节点的节点树结构作为一个可视资源区域。3.如权利要求2所述的方法,其中,所述节点树结构以层级上最接近所述衍生访问节点的上级div节点作为祖先节点。4.如权利要求2所述的方法,其中,按照预定识别规则识别可视资源区域还包括:将所述目标页面中的主题内容排除在可视资源区域之外。5.如权利要求1-4中任一项所述的方法,还包括:根据被用户选择滤除的可视资源区域制定页面过滤规则;以及对后续页面中符合所述页面过滤规则的页面区域进行屏蔽。6.如权利要求5所述的方法,其中,所述方法还包括:在用户选择所述可视资源区域之前,确定是否需要应用已有页面过滤规则,并对目标页面中符合所述已有页面过滤规则的页面区域做出屏蔽。7.如权利要求5所述的方法,根据被用户选择滤除的可视资源区域制定页面过滤规则包括:提取被屏蔽的可视资源区域在目标网页中的位置特征和/或层次特征;以及根据所述位置特征和/或所述层次特征制定页面过滤规则。8.如权利要求7所述的方法,其中,所述可视资源区域对应于当前页面DOM树的节点树结构,并且所述节点树结构包含点击后产生对非当前页面的页面访问的衍生访问节点。9.如权利要求8所述的方法,其中,对应于可视资源区域的节点树结构以层级上最接近所述衍生访问节点的上级div节点作为祖先节点。10.如权利要求8所述的方法,其中,所述位置特征是所述节点树结构的祖先节点在当前页面DOM树中的XPath位置;以及所述层次特征是所述祖先节点到所述衍生访问节点的XPath路径。11.如权利要求7所述的方法,其中,根据被用户选择滤除的可视资源区域制定页面过滤规则还包括:提取可视资源区域被屏蔽的目标网页的域名信息;以及针对具有相同域名信息的后续页面应用所述页面过滤规则。12.如权利要求5所述的方法,其中,屏蔽需要滤除的页面资源包括:将需要滤除的节点树结构的祖先节点的显示属性设为“None”;或者把所述祖先节点及其子孙节点从所述页面的DOM树删除。13.一种页面资源自动过滤方法,包括:获取如权利要求6-12任一项所述的页面资源过滤方法所制定的页面过滤规则;利用获取的页面过滤规则,自动修正页面资源过滤模型。14.如权利要求13所述的方法,其中,利用获取的...

【专利技术属性】
技术研发人员:吴伟勇
申请(专利权)人:广州市动景计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1