数据智能查询方法、装置、设备及存储介质制造方法及图纸

技术编号:24091990 阅读:33 留言:0更新日期:2020-05-09 08:29
本发明专利技术公开了一种数据智能查询方法,属于遍历查询技术领域。该方法包括以下步骤:执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页;采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构;通过遍历所述DOM树结构中各个节点依次提取信息;将所述信息按提取顺序依次写入预设的文档模板中生成文件。本发明专利技术过采用RPA技术代替重复性的人工处理过程,降低对人工操作的依赖,从而有效降低人工操作可能带来的风险,同时避免了人工操作可能带来的信息泄露的风险。

Data intelligent query method, device, equipment and storage medium

【技术实现步骤摘要】
数据智能查询方法、装置、设备及存储介质
本专利技术涉及遍历查询
,涉及一种数据智能查询方法、装置、设备及存储介质。
技术介绍
征信信息在信贷业务中意义重大,征信信息有不良记录的话,在办理贷款时,会被降低贷款额度或审批拒绝。征信报告查询更是金融机构信贷审批的必要环节。目前征信平台给资产优良的金融机构开放了接口查询方式,但更多的金融机构没有接口方式的征信查询技术。只能通过人工方式,以用户名、密码登陆征信平台网站,输入被查人信息进行查询。查询出结果后,手工摘录出征信关键字段,逐条拷贝到贷款平台,进行信贷审批。该人工处理过程,效率低下。信息拷贝不全,容易出现数据项丢失情况。数据项一旦丢失若未及时发现,会导致风控模型不准确,最终产生信用风险,金融机构蒙受损失。而且征信信息是个人的重要隐私,以人工登录征信平台进行征信信息查询的方式,若操作不当,还会产生信息泄露的风险。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中人工查询信息容易发生信息泄露、数据丢失等问题,提出了一种数据智能查询方法、装置、设备及存储介质,通过引入RPA(机器人流程自动化)技术代替人工重复操作的登录查询工作,避免了人工操作可能带来的风险。本专利技术是通过下述技术方案来解决上述技术问题:一种数据智能查询方法,包括以下步骤:执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页;采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构;<br>通过遍历所述DOM树结构中各个节点依次提取信息;将所述信息按提取顺序依次写入预设的文档模板中生成文件。优选地,还包括所述事件操作脚本的自动生成步骤:通过事件监听方式获取人工登录系统并下载所述系统的网页过程中的操作事件和所述操作事件对应的操作顺序;根据获取到的所述操作事件和所述操作顺序自动生成所述操作脚本。优选地,所述根据获取到的所述操作事件和所述操作顺序自动生成所述事件操作脚本包括以下步骤:根据获取到的所述操作事件,调取预设的与所述操作事件的类型对应的实现方法代码;将调取的所述代码写入预设的脚本文件的相应字段中;当所述操作事件包含输入内容时,将所述输入内容写入所述代码的对应字段中。优选地,当所述输入内容来源于实时识别的图片或文字时,所述脚本文件的相应字段中添加有调用第三方识别系统的代码,所述第三方识别系统返回的结果自动回填至所述脚本文件中对应实现方法的代码中。优选地,所述结构化解析通过获取所述网页中的标签和各个标签之间的嵌套关系和层级关系,解析出所述网页的DOM树结构。优选地,所述将所述信息按提取顺序依次写入预设的文档模板中生成文件包括以下步骤:提取所述元素节点中的内容,判断所述元素节点是否具有下一级元素节点,若有则获取所述元素节点对应的文本节点的内容和所述下一级元素节点对应的文本节点的子内容,所述子内容为所述信息;将所述子内容写入所述文档模板中与所述内容相对应的编辑区域内;根据写入所述子内容后的所述文档模板生成文件。本专利技术还公开了一种数据智能查询装置,包括:网页下载模块,用于执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页;网页解析模块,用于采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构;信息提取模块,用于通过遍历所述DOM树结构中各个节点依次提取信息;文件生成模块,用于将所述信息按提取顺序依次写入预设的文档模板中生成文件。优选地,该装置还包括:脚本生成模块,用于通过事件监听方式获取人工登录系统并下载所述系统的网页过程中的操作事件和所述操作事件对应的操作顺序;根据获取到的所述操作事件和所述操作顺序自动生成所述操作脚本。本专利技术还公开了一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时实现前述的数据智能查询方法的步骤。本专利技术还公开了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以实现前述的数据智能查询方法的步骤。本专利技术的积极进步效果在于:通过采用RPA技术代替重复性的人工处理过程,降低对人工操作的依赖,从而有效降低人工操作可能带来的风险,同时避免了人工操作可能带来的信息泄露的风险。附图说明图1示出了本专利技术数据智能查询方法实施例一的流程图;图2示出了本专利技术数据智能查询方法实施例一中关于文件生成的流程图;图3示出了一种DOM树结构示意图;图4示出了本专利技术数据智能查询方法实施例二的流程图;图5示出了本专利技术数据智能查询装置第一实施例的结构图;图6示出了本专利技术数据智能查询装置第二实施例的结构图;图7示出了本专利技术计算机设备一实施例的硬件架构示意图。具体实施方式下面通过实施例的方式进一步说明本专利技术,但并不因此将本专利技术限制在所述的实施例范围之中。首先,本专利技术提出一种数据智能查询方法。在实施例一中,如图1所示,所述的数据智能查询方法包括如下步骤:步骤10:执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页。以征信系统为例,事件操作脚本中记录了模拟人工下登录征信系统并下载征信系统网页的操作过程的代码,通过执行这些代码可以自动登录征信系统并下载所需网页。操作过程具体可能包括登录平台、查询所要下载的数据、下载查询结果的网页等,整个操作过程会涉及鼠标和键盘的操作,这些操作都以代码形式记录在事件操作脚本中,运行这些代码就可以自动下载所要的网页了。征信信息属于个人的重要隐私,如果采用人工登录征信平台进行征信信息查询的方式,一旦操作不当,很容易产生信息泄露的风险。这里通过执行事件操作脚本自动登录、下载所要查询的信息,大大避免了数据外泄风险,同时简化了操作流程。步骤20:采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构。常见的HTML网页的结构化解析方法包括DOM解析方式、字符串首尾截取方式、正则表达式等,这里具体采用DOM解析方式,通过获取所述网页中的标签和各个标签之间的嵌套关系和层级关系,解析出所述网页的DOM树结构。这里的网页采用DOM树结构的HTML网页,各个节点通过标签来体现。这种结构的网页,HTML文件均以<html>标记开始,以</html>标记结束。<head>...</head>标记之间的内容用于描述页面的头部信息,如页面的标题、作者、摘要、关键词、版权、自动刷新等信息。在<body>...</body>标记之间的内容即为页面的主体内容。<title>标记用于定义页面的标题,是成对标记,位于<head>本文档来自技高网...

【技术保护点】
1.一种数据智能查询方法,其特征在于,包括以下步骤:/n执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页;/n采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构;/n通过遍历所述DOM树结构中各个节点依次提取信息;/n将所述信息按提取顺序依次写入预设的文档模板中生成文件。/n

【技术特征摘要】
1.一种数据智能查询方法,其特征在于,包括以下步骤:
执行预设的事件操作脚本登录系统并下载所述系统的网页,所述网页为DOM树结构的HTML网页;
采用DOM解析方式对所述网页进行结构化解析,得到所述网页的DOM树结构;
通过遍历所述DOM树结构中各个节点依次提取信息;
将所述信息按提取顺序依次写入预设的文档模板中生成文件。


2.根据权利要求1所述的数据智能查询方法,其特征在于,还包括所述事件操作脚本的自动生成步骤:
通过事件监听方式获取人工登录系统并下载所述系统的网页过程中的操作事件和所述操作事件对应的操作顺序;
根据获取到的所述操作事件和所述操作顺序自动生成所述操作脚本。


3.根据权利要求2所述的数据智能查询方法,其特征在于,所述根据获取到的所述操作事件和所述操作顺序自动生成所述事件操作脚本包括以下步骤:
根据获取到的所述操作事件,调取预设的与所述操作事件的类型对应的实现方法代码;
将调取的所述代码写入预设的脚本文件的相应字段中;
当所述操作事件包含输入内容时,将所述输入内容写入所述代码的对应字段中。


4.根据权利要求3所述的数据智能查询方法,其特征在于,当所述输入内容来源于实时识别的图片或文字时,所述脚本文件的相应字段中添加有调用第三方识别系统的代码,所述第三方识别系统返回的结果自动回填至所述脚本文件中对应实现方法的代码中。


5.根据权利要求1所述的数据智能查询方法,其特征在于,所述结构化解析通过获取所述网页中的标签和各个标签之间的嵌套关系和层级关系,解析所述网页的DOM树结构。


6.根据权利要求5所述的数据智能...

【专利技术属性】
技术研发人员:谢伟
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1