一种基于可视化操作获取XPATH的数据接口生成方法技术

技术编号:31594042 阅读:24 留言:0更新日期:2021-12-25 11:42
本发明专利技术公开了一种基于可视化操作获取XPATH的数据接口生成方法,涉及XPATH获取技术领域,解决现有技术不能适用于不同网页结构的问题,包括以下步骤:依据输入的目标网页地址下载该网页的数据结构,并将其在系统的可视化界面进行展示;在可视化界面的参数配置页面添加要抓取的数据,并录入数据类型,数据类型为列表类型或数值类型或字符串类型;在可视化界面展示目标网页,光标移动到要抓取的数据的位置后得到标签,点击标签获取数据的XPATH地址;基于要抓取的数据的XPATH根据要抓取的值属性完成数据抓取,并生成对外的API接口地址;本发明专利技术可视化且适用性广的优点。明可视化且适用性广的优点。明可视化且适用性广的优点。

【技术实现步骤摘要】
一种基于可视化操作获取XPATH的数据接口生成方法


[0001]本专利技术涉及XPATH获取
,更具体的是涉及基于可视化操作获取XPATH的数据接口生成方法。

技术介绍

[0002]XPATH即为XML路径语言,它是一种用来确定XML文档中某部分位置的语言。XPATH基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPATH的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型,但是XPATH很快的被开发者采用来当作小型查询语言。XPATH 使用路径表达式来选取 XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。路径表达式是从一个XML节点,即当前的上下文节点到另一个节点、或一组节点的书面步骤顺序,这些步骤以“/”字符分开。
[0003]目前各行业大数据应用实现的第一步是从众多信息系统和数据库系统中获取基础数据。目前主流的采集方式有接口调用采集、数据包获取采集和网页信息采集。基于传统的数据采集方式,建设过程中需要使用原系统的数据接口,过程中出现了众多问题,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于可视化操作获取XPATH的数据接口生成方法,其特征在于,包括以下步骤:步骤S1:依据输入的目标网页地址下载该网页的数据结构,并将其在系统的可视化界面进行展示;步骤S2:在可视化界面的参数配置页面添加要抓取的数据,并录入数据类型,数据类型为列表类型或数值类型或字符串类型;步骤S3:在可视化界面展示目标网页,光标移动到要抓取的数据的位置后得到标签,点击标签获取数据的XPATH地址;步骤S4:根据要抓取的数据的值属性和XPATH完成数据抓取,并生成对外的API接口地址。2.根据权利要求1所述的一种基于可视化操作获取XPATH的数据接口生成方法,其特征在于,在所述步骤S1中下载该网页的数据结构前判断目标网页是否需要配置登录模板,若是则配置登录模板,若否则不进行配置;登录模板包括用于目标网页登录的用户名和密码。3.根据权利要求2所述的一种基于可视化操作获取XPATH的数据接口生成方法,其特征在于,所述配置登录模板具体包括以下步骤:步骤S11:在登录模板配置页面中输入目标系统的用户名和密码;步骤S12:在登录模板配置页面中输入目标系统的用户名控件和密码控件的XPATH地址;步骤S13:在登录模板配置页面中输入登录按钮的XPATH地址;步骤S14:将用户名和密码传入selenium中完成模拟登陆;步骤S15:保存cookies到数据库。4.根据权利要求3所述的一种基于可视化操作获取XPATH的数据接口生成方法,其特征在于,在步骤S2的录入操作前判断是否需要登录,若是则采用所述登录模板执行登录操作,若否则不执行登录操作。5.根据权利要求4所述的一种基于可视化操作获取XPATH的数据接口生成方法,其特征在于,在所述步骤S2中采用所述登录模板执行登录操作的具体方法为:通过对应的所述登录模板,使用所述cookies并加载到当前selenium中。6.根据权利要求1...

【专利技术属性】
技术研发人员:刘绍军邓明亮刘亚欧
申请(专利权)人:垒知科技集团四川有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1