页面处理方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:24708328 阅读:23 留言:0更新日期:2020-07-01 00:01
本公开实施例提供了一种页面处理方法、装置、电子设备和计算机可读介质,该方法包括:根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符合召回规则的布局对象节点;基于预设的节点预测模型,预测符合召回规则的布局对象节点是否为指定目标节点;对指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经屏蔽处理后的页面。

【技术实现步骤摘要】
页面处理方法、装置、电子设备和计算机可读介质
本公开实施例涉及计算机
,特别涉及一种页面处理方法、装置、电子设备和计算机可读介质。
技术介绍
随着移动互联网的全面普及,越来越多的站点在移动场景下进行广告营销和应用推广。一方面,受限于移动设备屏幕的限制,广告等元素对用户的浏览体验的影响越来越明显;另一方面,一些站点为了最大限度地获取短的利益,在网站上挂载大量虚假、色情以及诱骗用户形式的广告元素,严重影响用户的浏览体验,破坏了移动生态安全。因此,应对网站显示的页面内容进行过滤,为移动搜索生态安全提供保障,从而提升用户浏览体验。
技术实现思路
本公开实施例提供一种页面处理方法、装置、电子设备和计算机可读介质。第一方面,本公开实施例提供一种页面处理方法,包括:根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符合召回规则的布局对象节点;基于预设的节点预测模型,预测符合召回规则的布局对象节点是否为指定目标节点;对指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经屏蔽处理后的页面。第二方面,本公开实施例提供一种页面处理装置,包括:节点确定模块,用于根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;节点筛选模块,用于对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符合召回规则的布局对象节点;模型预测模块,用于基于预设的节点预测模型,预测符合召回规则的布局对象节点是否为指定目标节点;屏蔽处理模块,用于对指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经屏蔽处理后的页面。第三方面,本公开实施例提供一种电子设备,其包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器上述任意一种页面处理方法;一个或多个I/O接口,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任意一种页面处理方法。本公开实施例提供的页面处理方法、装置、电子设备和计算机可读介质,采用召回规则与节点预测模型结合的方式对页面进行处理,针对经过召回规则筛选后的布局对象节点,再利用节点预测模型进行判定是否影响浏览体验,从而对预测得到的影响浏览体验的布局对象节点进行屏蔽处理,整体上优化页面浏览体验,为移动搜索生态安全提供保障。附图说明附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:图1为本公开实施例提供的一种页面处理的架构示意图;图2为本公开一实施例的页面处理方法的流程图;图3为本公开示例性实施例中召回规则的示意图;图4为本公开另一实施例的页面处理方法的流程图;图5为本公开页面处理方法的效果示意图;图6为本公开实施例提供的一种页面处理装置的组成框图;图7为本公开实施例提供的一种电子设备的组成框图;图8为本公开实施例提供的一种计算机可读介质的组成框图。具体实施方式为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的页面处理方法、装置、电子设备和计算机可读介质进行详细描述。在下文中将参考附图更充分地描述示例实施例,但是示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。图1是本公开一实施例的页面处理的架构示意图。如图1所示,该架构可以包括:移动设备20和网站30,其中,移动设备20可以包括浏览器内核21、内存22和显示屏23;网站30中可以包括多个页面31。其中,移动设备20可以包括但不限于:个人电脑、智能手机、平板电脑、个人数字助理、服务器等。它们均可以安装有各种应用(App),例如邮箱App等。本公开实施例中的页面31,包括但不限于是落地页。落地页可以用于表示独立的网页,并可以用于营销或广告活动,例如用户或访问者通过点击搜索出来的广告或通过付费搜索渠道点击进入的页面。在一个实施例中,当用户10通过移动设备20访问网站30,并点击网站30中的一个页面31的统一资源定位器(UniformResourceLocator,URL)后,浏览内核21根据URL发起超文本标记语言(HypertextMarkupLanguage,HTML)文件下载,并对下载得到的HTML文件进行解析得到DOM(DocumentObjectModel)树,同时在解析得到HTML文件上的层叠样式表(CascadingStyleSheets,CSS)以及脚本语言(JavaScript,JS)文件等资源链接时,发起CSS文件下载和JS文件下载,下载得到的CSS文件和JS文件保存在内存22中。由于网页站点的行为变化非常快,通过配置规则集合无法穷举所有的类型和页面;且不是所有的广告都是影响用户浏览体验,当广告元素处于不影响页面主体内容浏览的位置且不存在诱导等行为时,是正常的商业行为,如果大面积误伤,也会破坏正常的互联网生态。但是目前很多方案无法区分处理上述正常商业行为的广告和影响用户浏览体验的广告;如果基于规则集对网页站点中的页面元素进行过滤,当规则集合过大时,网页加载的速度会受到明显的影响。本公开实施例可以提供一种页面处理方法,在移动设备20的显示屏23显示页面31之前,通过在浏览器内核21渲染阶段智能识别页面31中页面元素的类型,并自动屏蔽影响用户浏览体验的页面元素,当页面31完成渲染后,用户10所看到的是经过优化后的页面,大幅度提升了用户浏览体验并为移动搜索生态安全提供了保障。下面各实施例均可以应用于本实施例的系统架构。为了描述简洁,下面各个实施例可以相互参考和引用。图2为本公开一实施例的页面处理方法的流程图。如图2所示,该页面处理方法可以包括如下步骤。S110,根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点。S120,对页面的任一布局对象节点进行布局后,利用预设的召回规则,对该任一布局对象节点进行筛选,得到多个布局对象节点中的符合召回规则的布局对象节点。S130,基于预设的节点预测模型,预测符合召回规则的布局对象节点是否为指定目标节点。S140,对指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经屏蔽处理后的页面。根据本公开实施例的页面处理方法,采用召回规本文档来自技高网...

【技术保护点】
1.一种页面处理方法,包括:/n根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;/n对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点;/n基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点;/n对所述指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经所述屏蔽处理后的页面。/n

【技术特征摘要】
1.一种页面处理方法,包括:
根据获取的超文本标记语言HTML文件,确定页面的多个布局对象节点;
对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点;
基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点;
对所述指定目标节点进行屏蔽处理,利用屏蔽处理后剩余的布局对象节点,生成经所述屏蔽处理后的页面。


2.根据权利要求1所述的方法,其中,在所述确定页面的多个布局对象节点之后,还包括:
若所述多个布局对象节点中包括通过脚本文件加载的布局对象节点,则将所述通过脚本文件加载的布局对象节点,作为符合所述召回规则的布局对象节点。


3.根据权利要求1所述的方法,其中,所述对所述页面的任一布局对象节点进行布局后,利用预设的召回规则,对所述任一布局对象节点进行筛选,得到所述多个布局对象节点中的符合所述召回规则的布局对象节点,包括:
对所述页面的任一布局对象节点进行布局,得到经所述布局的布局对象节点的属性信息;
判断所述属性信息是否符合所述召回规则中限定的节点召回条件;
将满足所述节点召回条件的布局对象节点,作为符合所述召回规则的布局对象节点。


4.根据权利要求3所述的方法,其中,
所述召回规则包括:预先根据节点宽高占比、节点内嵌形式、节点位置特征、节点内容、节点产生机制和节点结构中的至少一项进行设置的规则。


5.根据权利要求1所述的方法,其中,在基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点之前,所述方法还包括:
将符合所述召回规则的布局对象节点,作为初次筛选得到的布局对象节点,确定所述初次筛选得到的布局对象节点的节点状态;
在所述页面的所有布局对象节点完成布局后,获取节点状态发生变化的布局对象节点;
再次利用预设的召回规则,对节点状态发生变化的布局对象节点进行筛选;
将所述初次筛选的布局对象节点和所述再次筛选得到的布局对象节点,作为符合所述召回规则的布局对象节点。


6.根据权利要求1所述的方法,其中,所述基于预设的节点预测模型,预测符合所述召回规则的布局对象节点是否为指定目标节点,包括:
根据所述符合所述召回规则的布局对象节点的属性信息,计算所述符合所述召回规则的布局对象节点的节点特征;
利用所述预设的节点预测模型处理所述节点特征,得到所述符合所述召回规则的布局对象节点为所述指定目标节...

【专利技术属性】
技术研发人员:雷小强王云飞
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1