网页信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34367056 阅读:17 留言:0更新日期:2022-07-31 09:18
本申请提供一种网页信息处理方法、装置、电子设备及计算机可读存储介质。其中方法包括:利用Base基类获取用户自定义的网页页面操作逻辑;编译所述页面操作逻辑,生成中间目标文件;上传所述中间目标文件到文档对象模型Dom分析程序端,以在动态执行所述页面操作逻辑的过程中得到用户自定义页面操作对应的Dom结构。相较于现有技术,本申请可以根据业务分析、检测的需要灵活地注入页面操作,从而获取正确的页面Dom结构。正确的页面Dom结构。正确的页面Dom结构。

Web page information processing method, device, electronic equipment and storage medium

【技术实现步骤摘要】
网页信息处理方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,具体涉及一种网页信息处理方法及装置、 一种电子设备以及一种计算机可读存储介质。

技术介绍

[0002]在HTML(超文本标记语言,HyperText Markup Language,简称HTML) 中DOM(文档对象模型,Document Object Model,简称DOM)是Web前端 里最基础、最常用的模型。例如,一个Web页面其实就是一个HTML文件, 经过浏览器的解析,最终呈现在用户面前。
[0003]随着Web应用的广泛使用,在很多技术场景,需要分析和检测Web页面 的Dom结构。在处理这类场景需求时,经常会面临页面Dom无法一次完全加 载的问题,在技术实现上,Web页面的Dom结构是随着页面操作而动态改变 的,如何根据业务分析、检测的需要灵活地注入页面操作,从而获取正确的页 面Dom结构是解决这类问题的一个痛点。

技术实现思路

[0004]本申请的目的是提供一种网页信息处理方法及装置、一种电子设备以及一 种计算机可读存储介质。
[0005]本申请第一方面提供一种网页信息处理方法,包括:
[0006]利用Base基类获取用户自定义的网页页面操作逻辑;
[0007]编译所述页面操作逻辑,生成中间目标文件;
[0008]上传所述中间目标文件到文档对象模型Dom分析程序端并动态执行所述 页面操作逻辑,以得到所述用户自定义页面操作对应的Dom结构。
[0009]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述利 用Base基类获取用户自定义的网页页面操作逻辑,包括:
[0010]获取自定义Base基类,所述Base基类包括抽象方法,所述抽象方法包含 参数WebDriver,所述WebDriver参数可用于传入实现自定义操作的WebDriver实例;
[0011]继承所述Base基类得到用户自定义网页页面操作逻辑对应的页面操作代 码。
[0012]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述继 承所述Base基类得到自定义网页页面操作逻辑对应的页面操作代码,包括:
[0013]继承所述Base基类得到用户自定义网页页面操作逻辑对应的Operator类;
[0014]其中,所述Operator类包括所述页面操作逻辑对应的页面操作代码。
[0015]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述编 译所述页面操作逻辑,生成中间目标文件,包括:
[0016]接收编译命令,根据所述编译命令获取预设编译工具;
[0017]利用所述预设编译工具编译所述自定义网页页面操作逻辑对应的页面操作 代码,生成中间目标文件。
[0018]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述预 设编译
工具为javac工具。
[0019]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述中 间目标文件为.class目标文件。
[0020]在一种可能的实现方式中,在本申请的上述网页信息处理方法中,所述上 传所述中间目标文件到文档对象模型Dom分析程序端,包括:
[0021]上传所述.class目标文件到Dom分析程序端,以通过反射机制加载所 述.class目标文件,动态执行用户注入的页面操作代码,执行过程中得到用户 自定义页面操作对应的Dom结构。
[0022]本申请第二方面提供一种网页信息处理装置,包括:
[0023]获取模块,用于利用Base基类获取用户自定义的网页页面操作逻辑;
[0024]编译模块,用于编译所述页面操作逻辑,生成中间目标文件;
[0025]分析模块,用于上传所述中间目标文件到文档对象模型Dom分析程序端 并动态执行所述页面操作逻辑,以得到所述用户自定义页面操作对应的Dom 结构。
[0026]在一种可能的实现方式中,在上述网页信息处理装置中,所述获取模块, 具体用于:
[0027]获取自定义Base基类,所述Base基类包括抽象方法,所述抽象方法包含 参数WebDriver,所述WebDriver参数可用于传入实现自定义操作的 WebDriver实例;
[0028]继承所述Base基类得到用户自定义网页页面操作逻辑对应的页面操作代 码。
[0029]在一种可能的实现方式中,在上述网页信息处理装置中,所述获取模块, 具体用于:
[0030]继承所述Base基类得到用户自定义网页页面操作逻辑对应的Operator类;
[0031]其中,所述Operator类包括所述页面操作逻辑对应的页面操作代码。
[0032]在一种可能的实现方式中,在上述网页信息处理装置中,所述编译模块, 具体用于:
[0033]接收编译命令,根据所述编译命令获取预设编译工具;
[0034]利用所述预设编译工具编译所述自定义网页页面操作逻辑对应的页面操作 代码,生成中间目标文件。
[0035]在一种可能的实现方式中,在上述网页信息处理装置中,所述预设编译工 具为javac工具。
[0036]在一种可能的实现方式中,在上述网页信息处理装置中,所述中间目标文 件为.class目标文件。
[0037]在一种可能的实现方式中,在上述网页信息处理装置中,所述分析模块, 具体用于:
[0038]上传所述.class目标文件到Dom分析程序端,以通过反射机制加载所 述.class目标文件,动态执行用户注入的页面操作代码,执行过程中得到用户 自定义页面操作对应的Dom结构。
[0039]本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述 存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机 程序时执行以实现本申请第一方面所述的方法。
[0040]本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令, 所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。
[0041]相较于现有技术,本申请提供的网页信息处理方法、装置、电子设备及介 质,利用Base基类获取用户自定义的网页页面操作逻辑;编译所述页面操作 逻辑,生成中间目标文件;上传所述中间目标文件到文档对象模型Dom分析 程序端,以在动态执行所述页面操作逻辑的过程中得到用户自定义页面操作对 应的Dom结构。相较于现有技术,本申请可以根据业务分析、检测的需要灵 活地注入页面操作,从而获取正确的页面Dom结构。
附图说明
[0042]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领 域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并 不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的 部件。在附图中:
[0043]图1示出了本申请提供的一种网页信息处理方法的流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页信息处理方法,其特征在于,包括:利用Base基类获取用户自定义的网页页面操作逻辑;编译所述页面操作逻辑,生成中间目标文件;上传所述中间目标文件到文档对象模型Dom分析程序端并动态执行所述页面操作逻辑,以得到所述用户自定义页面操作对应的Dom结构。2.根据权利要求1所述的方法,其特征在于,所述利用Base基类获取用户自定义的网页页面操作逻辑,包括:获取自定义Base基类,所述Base基类包括抽象方法,所述抽象方法包含参数WebDriver,所述WebDriver参数可用于传入实现自定义操作的WebDriver实例;继承所述Base基类得到用户自定义网页页面操作逻辑对应的页面操作代码。3.根据权利要求2所述的方法,其特征在于,所述继承所述Base基类得到自定义网页页面操作逻辑对应的页面操作代码,包括:继承所述Base基类得到用户自定义网页页面操作逻辑对应的Operator类;其中,所述Operator类包括所述页面操作逻辑对应的页面操作代码。4.根据权利要求2所述的方法,其特征在于,所述编译所述页面操作逻辑,生成中间目标文件,包括:接收编译命令,根据所述编译命令获取预设编译工具;利用所述预设编译工具编译所述自定义网页页面操作逻辑对应的页面操作代码,生成中...

【专利技术属性】
技术研发人员:艾可德
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1