一种非侵入式政务数据的获取方法技术

技术编号:35498634 阅读:16 留言:0更新日期:2022-11-05 17:01
本发明专利技术涉及政务信息处理技术领域,公开了一种非侵入式政务数据的获取方法,包括:根据信息获取任务获取执行平台的目标平台信息,根据所述目标平台信息获取所需运行环境的兼容版本,根据所述信息获取任务配置具有兼容版本的虚拟机平台,更新所述虚拟机平台的标识符和所述虚拟机平台的轮询数据库,获取所述信息获取任务和与所述信息获取任务匹配的方法类,加载和实例化方法类,使用实例化后的方法类模拟用户操作事件,响应用户操作事件,通过屏幕截取或键鼠事件复制文本获取信息,根据所述虚拟机平台获取的信息更新所述信息获取任务的状态。本发明专利技术可以针对不同类型的需求动态配置资源以获取电子政务数据,具有较好的适配性和扩展性。展性。展性。

【技术实现步骤摘要】
一种非侵入式政务数据的获取方法


[0001]本专利技术涉及政务信息处理领域,尤其涉及一种非侵入式政务数据的获取方法。

技术介绍

[0002]RPA机器人是一种基于计算机变成以及规则的软件,通过执行重复的、基于规则的任务来实现人工操作自动化的一种技术。
[0003]在政务信息处理过程中,涉及信息的获取和处理需要涉及多个终端和数据来源,对于数据的处理不仅要考虑速度,而且要考虑兼容性和资源调度的问题,如部分页面的设计需要兼容模式的浏览器或特定的操作系统方可以访问,部分信息的获取方式需要运行虚拟机以运行App的方式获取,部分信息源对渲染环境存在需求,因此需要多种客户端和配置来满足需求。
[0004]另外,部分信息页面禁止了后台调试并针对不同的访问者提供了不同的输出,针对此进行额外必要的配置是必要的。

技术实现思路

[0005]本专利技术的目的在于克服上述一种或多种现有的技术问题,提供一种非侵入式政务数据的获取方法。
[0006]为实现上述目的,本专利技术提供的一种非侵入式政务数据的获取方法,包括:根据信息获取任务获取执行平台的目标平台信息,根据所述目标平台信息获取所需运行环境的兼容版本;根据所述信息获取任务配置具有兼容版本的虚拟机平台,更新所述虚拟机平台的标识符和所述虚拟机平台的轮询数据库;获取所述信息获取任务和与所述信息获取任务匹配的方法类,加载和实例化方法类;使用实例化后的方法类模拟用户操作事件,响应用户操作事件,通过屏幕截取或键鼠事件复制文本获取信息;根据所述虚拟机平台获取的信息更新所述信息获取任务的状态。
[0007]根据本专利技术的一个方面,所述目标平台信息包括运行时信息、系统版本信息、浏览器信息、客户端信息、网络地址信息、软件信息、配置信息;所述的运行时信息包括JRE、.netFramework、Python运行时、LUA运行时;所述系统版本信息包括Windows、Linux、中标麒麟;所述浏览器信息包括IE、Firefox、Edge、Chrome、360、Opear、腾讯浏览器、百度浏览器;所述客户端信息包括客户端的版本,客户端为安装于所述虚拟机平台上的客户端,用于获取所述轮询数据库内的指令;所述网络地址信息为配置的IP地址信息或者所使用的代理IP地址信息;
所述软件信息为所述虚拟机平台上安装的程序名称、程序版本;所述配置信息包括为所述虚拟机平台配置的核心数目、核心频率、最大配置内存、已经使用内存、硬盘大小。
[0008]根据本专利技术的一个方面,根据所述目标平台信息获取所需客户端的兼容版本,在所述信息获取任务所涉及的软件运行时或资源运行时,对所述目标平台信息进行扩展,获得所述目标平台信息所需运行环境的兼容版本,遍历所有所述虚拟机平台的实例,获取符合所述目标平台信息的实例。
[0009]根据本专利技术的一个方面,根据所需运行环境的兼容版本,遍历所述虚拟机平台,选择含有兼容版本的运行环境的所述虚拟机平台,得到所述虚拟机平台的标识符集合,将其添加至数据库内。
[0010]根据本专利技术的一个方面,获取服务器内所有未执行的任务,提取匹配未执行任务的所述虚拟机平台的标识符和频次,在一个标识符的频次超过阈值时,通过本地VMAPI创建所述虚拟机平台的副本,配置其网络环境,注册新的所述虚拟机平台;VMAPI为HyperVAPI或VMWare api。
[0011]根据本专利技术的一个方面,方法类为编译后的字节码或者脚本,方法类为字节码时,所述虚拟机平台上的客户端加载编译后的字节码,创建其实例,并执行信息的采集操作;方法类为脚本时,调用相应的解释器,执行脚本;脚本包括LUA脚本、js脚本、python脚本。
[0012]根据本专利技术的一个方面,模拟用户操作事件包括鼠标的移动、鼠标的按下、鼠标的点击、鼠标的释放、按键的按下、按键的释放、向窗口发送键盘消息、向窗口发送鼠标消息。
[0013]根据本专利技术的一个方面,客户端执行信息截取的屏幕图像,判断屏幕图像范围内是否包括待输入信息的元素,如果不包括,则抛出异常并返回;如果包括,则将鼠标移动到元素的位置,通过模拟键盘输入事件输入采集任务所包括的字符。
[0014]根据本专利技术的一个方面,客户端执行信息截取的屏幕图像,判断模拟键盘输入事件后屏幕图像的内容是否产生了符合所述信息获取任务需求的变化;变化包括截图的改变,区域内其他元素的更新。
[0015]根据本专利技术的一个方面,客户端执行信息截取的屏幕图像,判断屏幕图像范围内是否包括待输入信息的元素,如果不包括,则抛出异常并返回;如果包括,则将鼠标移动到元素的位置,通过模拟鼠标输入采集任务所包含的鼠标操作。
[0016]根据本专利技术的一个方面,客户端执行信息截取的屏幕图像,判断模拟鼠标输入事件后屏幕图像的内容是否产生了符合信息获取任务需求的变化;变化包括截图的改变,区域内其他元素的更新。
[0017]根据本专利技术的一个方面,客户端模拟鼠标或者键盘,使屏幕图像的控件上渲染的内容被选中,将被选中的内容复制到剪贴板中,读取并保存剪贴板内的数据。
[0018]根据本专利技术的一个方面,客户端截取的屏幕图像,将屏幕图像复制到剪贴板中,对屏幕图像进行识别,获取屏幕图像中的内容并保存数据。
[0019]根据本专利技术的一个方面,客户端在执行所述信息获取任务时记录客户端和所述虚拟机平台的活跃时间。
[0020]根据本专利技术的一个方面,获取服务器内所有未执行的任务和获取和未执行任务匹配的所有的所述虚拟机平台,获得其差集,遍历差集内的元素,如果差集内所述虚拟机平台
的闲置时间超过阈值时,通过本地VMAPI关闭虚拟机。
[0021]为实现上述目的,本专利技术提供一种非侵入式政务数据的获取系统,包括:运行环境获取模块:根据信息获取任务获取执行平台的目标平台信息,根据所述目标平台信息获取所需运行环境的兼容版本;虚拟机平台建立模块:根据所述信息获取任务配置具有兼容版本的虚拟机平台,更新所述虚拟机平台的标识符和所述虚拟机平台的轮询数据库;方法类处理模块:获取所述信息获取任务和与所述信息获取任务匹配的方法类,加载和实例化方法类;信息获取模块:使用实例化后的方法类模拟用户操作事件,响应用户操作事件,通过屏幕截取或键鼠事件复制文本获取信息;任务更新模块:根据所述虚拟机平台获取的信息更新所述信息获取任务的状态。
[0022]基于此,本专利技术的有益效果在于:(1)电子政务数据的获取采取非侵入式的方式进行,从而避免了其他信息获取方式可能引起的错误信息;(2)采集过程通过运行虚拟机资源进行,虚拟机的资源可以根据需求进行动态的拓展,具有较好的扩展性;(3)通过检测所运行的虚拟机上的客户端和环境和信息获取任务的兼容性,从而可以实现任务的分配调度;(4)通过检测资源的占用可以实现动态的扩容和收缩,优化资源调度。
附图说明
[0023]图1示意性表示根据本专利技术的一种非侵入式政务数据的获取方法的流程图;图2示意性表示根据本专利技术的一种非侵入式政务数据的获取系统的流程图。
具体实施方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非侵入式政务数据的获取方法,包括:根据信息获取任务获取执行平台的目标平台信息,根据所述目标平台信息获取所需运行环境的兼容版本;根据所述信息获取任务配置具有兼容版本的虚拟机平台,更新所述虚拟机平台的标识符和所述虚拟机平台的轮询数据库;获取所述信息获取任务和与所述信息获取任务匹配的方法类,加载和实例化方法类;使用实例化后的方法类模拟用户操作事件,响应用户操作事件,通过屏幕截取或键鼠事件复制文本获取信息;根据所述虚拟机平台获取的信息更新所述信息获取任务的状态。2.根据权利要求1所述的一种非侵入式政务数据的获取方法,其特征在于,所述目标平台信息包括运行时信息、系统版本信息、浏览器信息、客户端信息、网络地址信息、软件信息、配置信息;所述的运行时信息包括JRE、.netFramework、Python运行时、LUA运行时;所述系统版本信息包括Windows、Linux、中标麒麟;所述浏览器信息包括IE、Firefox、Edge、Chrome、360、Opear、腾讯浏览器、百度浏览器;所述客户端信息包括客户端的版本,客户端为安装于所述虚拟机平台上的客户端,用于获取所述轮询数据库内的指令;所述网络地址信息为配置的IP地址信息或者所使用的代理IP地址信息;所述软件信息为所述虚拟机平台上安装的程序名称、程序版本;所述配置信息包括为所述虚拟机平台配置的核心数目、核心频率、最大配置内存、已经使用内存、硬盘大小。3.根据权利要求2所述的一种非侵入式政务数据的获取方法,其特征在于,根据所述目标平台信息获取所需客户端的兼容版本,在所述信息获取任务所涉及的软件运行时或资源运行时,对所述目标平台信息进行扩展,获得所述目标平台信息所需运行环境的兼容版本,遍历所有所述虚拟机平台的实例,获取符合所述目标平台信息的实例。4.根据权利要求3所述的一种非侵入式政务数据的获取方法,其特征在于,根据所需运行环境的兼容版本,遍历所述虚拟机平台,选择含有兼容版本的运行环境的所述虚拟机平台,得到所述虚拟机平台的标识符集合,将其添加至数据库内。5.根据权利要求4所述的一种非侵入式政务数据的获取方法,其特征在于,获取服务器内所有未执行的任务,提取匹配未执行任务的所述虚拟机平台的标识符和频次,在一个标识符的频次超过阈值时,通过本地VMAPI创建所述虚拟机平台的副本,配置其网络环境,注册新的所述虚拟机平台;VMAPI为HyperVAPI或VMWare api。6.根据权利要求5所述的一种非侵入式政务数据的获取方法,其特征在于,方法类为编译后的字节码或者脚本,方法类为字节码时,所述虚拟机平台上的客户端加载编译后的字节码,创建其实例,并执行信息的采集操作;方法类为脚本时,调用相应的解释器,执行脚本;脚本包括LUA脚本、js脚本、python脚本。7.根据权利要求6所述的一种非侵入式政务数据的获取方法,其特征在于,模拟用...

【专利技术属性】
技术研发人员:傅涛
申请(专利权)人:北京易特思维信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1