【技术实现步骤摘要】
页面处理方法、装置、电子设备和计算机可读介质
本公开实施例涉及计算机
,特别涉及一种页面处理方法、装置、电子设备和计算机可读介质。
技术介绍
随着移动互联网的全面普及,越来越多的站点在移动场景下进行广告营销和应用推广。一方面,受限于移动设备屏幕的限制,广告等元素对用户的浏览体验的影响越来越明显;另一方面,一些站点为了最大限度地获取短的利益,在网站上挂载大量虚假、色情以及诱骗用户形式的广告元素,严重影响用户的浏览体验,破坏了移动生态安全。因此,应对网站显示的页面内容进行过滤,为移动搜索生态安全提供保障,从而提升用户浏览体验。
技术实现思路
本公开实施例提供一种页面处理方法、装置、电子设备和计算机可读介质。第一方面,本公开实施例提供一种页面处理方法,包括:根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符合召回规则的布局对象节点;基于预设的节点预测模型,预测符合召回规则的布局对象节点是否为指定目标节点;对指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经屏蔽处理后的页面。第二方面,本公开实施例提供一种页面处理装置,包括:节点确定模块,用于根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;节点筛选模块,用于对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符 ...
【技术保护点】
1.一种页面处理方法,包括:/n根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;/n对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点;/n基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点;/n对所述指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经所述屏蔽处理后的页面。/n
【技术特征摘要】
1.一种页面处理方法,包括:
根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;
对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点;
基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点;
对所述指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经所述屏蔽处理后的页面。
2.根据权利要求1所述的方法,其中,在所述确定页面的多个布局对象节点之后,还包括:
若所述多个布局对象节点中包括通过脚本文件加载的布局对象节点,则将所述通过脚本文件加载的布局对象节点,作为符合所述召回规则的布局对象节点。
3.根据权利要求1所述的方法,其中,所述对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点,包括:
对所述页面的任一布局对象节点进行布局,得到经所述布局的布局对象节点的属性信息;
判断所述属性信息是否符合所述召回规则中限定的节点召回条件;
将满足所述节点召回条件的布局对象节点,作为符合所述召回规则的布局对象节点。
4.根据权利要求3所述的方法,其中,
所述召回规则包括:预先根据节点宽高占比、节点内嵌形式、节点位置特征、节点内容、节点产生机制和节点结构中的至少一项进行设置的规则。
5.根据权利要求1所述的方法,其中,在基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点之前,所述方法还包括:
将符合所述召回规则的布局对象节点,作为初次筛选得到的布局对象节点,确定所述初次筛选得到的布局对象节点的节点状态;
在所述页面的所有布局对象节点完成布局后,获取节点状态发生变化的布局对象节点;
再次利用预设的召回规则,对节点状态发生变化的布局对象节点进行筛选;
将所述初次筛选的布局对象节点和所述再次筛选得到的布局对象节点,作为符合所述召回规则的布局对象节点。
6.根据权利要求1所述的方法,其中,所述基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点,包括:
根据所述符合所述召回规则的布局对象节点的属性信息,计算所述符合所述召回规则的布局对象节点的节点特征;
利用所述预设的节点预测模型处理所述节点特征,得到所述符合所述召回规则的布局对象节点为所述指定目标节...
【专利技术属性】
技术研发人员:雷小强,王云飞,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。