The application embodiment provides a page data filtering method, device and user terminal. The method includes: obtaining the page resources, generating the first page according to the page resources, obtaining the page resources again, generating second pages according to the page resources, comparing all the node identification information of the first page with all the node identification information of the second page, and in the first page. The nodes corresponding to the node identification information that appear only on the first page without appearing on the second page are removed. By generating two pages of the same page resource and filtering out the two pages, the embodiment of the invention has only once appeared the nodes corresponding to the node identification information once, and the filtering of the random data generated by the node identification information is realized.
【技术实现步骤摘要】
页面数据过滤方法、装置及用户终端
本申请涉及计算机
,具体而言,涉及一种页面数据过滤方法、装置及用户终端。
技术介绍
随着互联网技术的发展,用户对网页浏览的需求越来越大,页面广告常常是用户在浏览网页时所不愿意看到的。如何在终端对页面广告进行,是业界普遍关心的问题。现在常见的广告过滤方法是基于一定的广告过滤规则进行过滤的,这种广告过滤规则是对页面信息对应节点的节点ID或节点属性进行匹配,匹配后过滤掉指定节点ID或节点属性的节点,从而达到过滤广告的目的,例如具体可以通过正则表达式或XPath来匹配页面上的节点。然而随着技术的发展,越来越多的广告投放者为了避免广告被屏蔽,在投放广告时,通过设置脚本程序来随机生成广告所对应节点的节点ID,来实现避免广告被现有的广告过滤技术过滤。申请内容有鉴于此,本申请实施例提供了一种页面数据过滤方法、装置及用户终端,能够对节点ID为随机生成的数据(例如广告信息)进行过滤。为实现上述目的,本申请实施例提供了一种页面数据过滤方法,所述方法包括:获取页面资源,并根据所述页面资源生成第一页面;再次获取所述页面资源,并根据所述页面资源生成第二页面;比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。本申请实施例还提供了一种页面数据过滤装置,所述装置包括:第一页面生成模块,用于获取页面资源,并根据所述页面资源生成第一页面;第二页面生成模块,用于再次获取所述页面资源,并根据所述页面资源生成第二页面;节点标识比较模块,用于比较所述第一页 ...
【技术保护点】
1.一种页面数据过滤方法,其特征在于,所述方法包括:获取页面资源,并根据所述页面资源生成第一页面;再次获取所述页面资源,并根据所述页面资源生成第二页面;比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。
【技术特征摘要】
1.一种页面数据过滤方法,其特征在于,所述方法包括:获取页面资源,并根据所述页面资源生成第一页面;再次获取所述页面资源,并根据所述页面资源生成第二页面;比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。2.根据权利要求1所述的方法,其特征在于,所述获取页面资源与再次获取所述页面资源的步骤,包括:从服务器获取页面资源;将所述页面资源存储至资源缓存区;从所述资源缓存区再次获取所述页面资源。3.根据权利要求1所述的方法,其特征在于,所述获取页面资源以及再次获取所述页面资源的步骤,均从服务器获取页面资源。4.根据权利要求1所述的方法,其特征在于,所述根据所述页面资源生成第一页面以及根据所述页面资源生成第二页面的步骤,包括:通过网页视图组件来根据所述页面资源加载第一页面;所述网页视图组件设置有隐藏框架;通过所述隐藏框架来根据所述页面资源加载第二页面。5.根据权利要求1所述的方法,其特征在于,所述根据所述页面资源生成第一页面以及根据所述页面资源生成第二页面的步骤,包括:通过第一网页视图组件来根据所述页面资源加载第一页面;通过第二网页视图组件来根据所述页面资源加载第二页面。6.根据权利要求1所述的方法,其特征在于,所述节点标识信息为节点ID信息。7.一种页面数据过滤装置,设置于用户终端,其特征在于,所述装置包括:第一页面生成模块,用于获取页面资源,并根据所述页面资源生成第一页面;第二页面生成模块,用于再次获取所述页面资源,并根据所述页面资源生成...
【专利技术属性】
技术研发人员:江锐洪,
申请(专利权)人:广州市动景计算机科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。