一种网页标签文本定位方法技术

技术编号:32234398 阅读:11 留言:0更新日期:2022-02-09 17:38
本发明专利技术公开了网页标签定位技术领域的一种网页标签文本定位方法,包括:响应于用户操作网页产生网页事件时,向网页DOM树中插入事件监控器;响应于用户操作网页控件时,于网页DOM树中定位当前操作控件所在结点;基于当前操作控件所在结点查找包含包含有效文本信息的结点;响应于查找到包含有效文本信息的结点后,将结点信息及标签发送至指定位置。本发明专利技术提供了一种简单有效的方法,自动定位操作控件对应的标签文本,在RPA流程中使用标签文本来表示操作控件,增加了更多的语义信息,方便用户理解。户理解。户理解。

【技术实现步骤摘要】
一种网页标签文本定位方法


[0001]本专利技术涉及一种网页标签文本定位方法,属于网页标签定位


技术介绍

[0002]在RPA流程中的每一步操作都包含两个方面的内容,即定位控件和执行相应的操作。对于网页控件,一般可以通过xpath或者cssselector来定位。由于xpath或者cssselector仅包含了控件的定位信息,未包含控件的语义信息,虽然可以用于精确定位,但是不方便人的理解。因此,在设计网页时,一般会用文字标签来表示控件的语义信息,用户操作页面时根据标签来定位和操作对应的控件。这个文字标签与实际操作的控件是两个控件,在位置上相邻。
[0003]对于网页控件,按钮的标签一般被放置于表示按钮节点的内部,可以直接提取,但是编辑框、选择框等控件的列表往往是在控件结点之外,在页面的绝对位置上相邻,在网页的DOM树中却没有比较明确的关系,不方便直接获取。若是没有表示语义的标签,仅使用控件的定位信息来表示控件,虽然能够正确执行RPA流程,但是让人来理解这些流程时就会发生困难,常常需要手动在页面上重新定位这些控件,查找它对应的语义信息,由于一个流程中可能有非常多的操作,使用整个过程非常麻烦。用户在阅读RPA流程时,若想知道这些控件的含义,还需要手动重新定位,非常不方便。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足,提供一种网页标签文本定位方法,能够达到自动定位网页标签,获取控件对应的标签文本的效果。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0006]第一方面,本专利技术提供了一种网页标签文本定位方法,包括:
[0007]响应于用户操作网页产生网页事件时,向网页DOM树中插入事件监控器;
[0008]响应于用户操作网页控件时,于网页DOM树中定位当前操作控件所在结点;
[0009]基于当前操作控件所在结点查找包含有效文本信息的结点;
[0010]响应于查找到包含有效文本信息的结点后,将结点信息及标签发送至指定位置。
[0011]进一步的,所述有效文本信息的判断标准为汉字数量不超过十个,且字符中间没有其他非文本字符串。
[0012]进一步的,基于当前操作控件所在结点查找包含有效文本信息的结点,包括:
[0013]获取当前操作控件所在结点在当前层级的序号N;
[0014]基于序号N的数值大小进行结点查找,包括:
[0015]响应于序号N大于零时,获取同一层级节点序号为N

1的结点;
[0016]响应于序号N为零时,获取当前操作控件所在结点的父结点;
[0017]基于当前操作控件所在结点的父结点在上一层级获取所述父结点的层级序号N,并重复结点查找过程;
[0018]响应于结点不包含有效文本信息时,跳过该结点继续向前查找;
[0019]响应于查找到包含有效文本信息的结点时,结束查找。
[0020]进一步的,基于当前操作控件所在结点查找包含有效文本信息的结点,包括:
[0021]获取当前操作控件所在结点在当前层级的序号N和位置;
[0022]基于序号N的数值大小进行结点查找,包括:
[0023]响应于序号N大于零时,获取同一层级节点序号为N

1的结点;
[0024]响应于序号N为零时,获取当前操作控件所在结点的父结点;
[0025]基于当前操作控件所在结点的父结点在上一层级获取所述父结点的层级序号N,并重复结点查找过程;
[0026]响应于结点不包含有效文本信息时,跳过该结点继续向前查找;
[0027]响应于查找到包含有效文本信息的结点时,记录该节点对应的有效文本信息和该节点在页面中的绝对位置;
[0028]响应于已查到包含有效文本信息的结点达到指定结点数量时,结束查找;
[0029]基于节点在页面的绝对位置选择第一个匹配到的结点。
[0030]进一步的,所述指定结点数量不大于五。
[0031]进一步的,基于节点在页面的绝对位置选择第一个匹配到的结点,包括:判断控件左边是否存在包含有效文本信息的对应结点,若存在则返回重叠面积最大的结点,否则判断控件上边是否存在包含有效文本信息的对应结点,若存在则返回重叠面积最大的结点,否则返回空。
[0032]进一步的,所述文本信息通过消息包的方式进行发送,所述消息包还包括操作类型、控件路径和时间戳。
[0033]进一步的,所述指定位置包括后台服务器、文件位置和缓存地址。
[0034]第二方面,一种网页标签文本定位装置,包括处理器及存储介质;
[0035]所述存储介质用于存储指令;
[0036]所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。
[0037]第三方面,计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
[0038]与现有技术相比,本专利技术所达到的有益效果:
[0039]一、本专利技术提供一种定位网页控件标签的方法,使用标签来代表控件,相比较于控件自身的路径,标签提供了更多的语义信息,所以更容易理解。在创建RPA流程时,使用标签就可以表示每一个操作的具体含义,在保证RPA流程正确执行的情况下,标签表示的结点让整个流程变得非常容易理解。
[0040]二、本专利技术利用标签一般位于控件左边和上边这一规律,以及网页DOM树的特性,提供了一个简单有效的方法,以极小的计算量获得了相对准确的结果。相比较于别的方法比如模板匹配,CV识别,它的计算量极少,准确率也差别不大,达到了较好平衡。
附图说明
[0041]下面结合附图和实施例对本专利技术做进一步的说明,其中:
[0042]图1是本专利技术实施例一提供的网页标签文本定位方法的系统框架示意图;
[0043]图2是本专利技术实施例一提供的网页标签文本定位方法的浏览器界面示意图;
[0044]图3是本专利技术实施例一提供的网页标签文本定位方法的DOM树示意图;
[0045]图4是本专利技术实施例一提供的网页标签文本定位方法的标签结点示意图;
[0046]图5是本专利技术实施例一提供的网页标签文本定位方法流程示意图;
[0047]图5a是本专利技术实施例一提供的查找网页标签结点方法流程示意图;
[0048]图5b是本专利技术实施例二提供的查找网页标签结点方法流程示意图;
具体实施方式
[0049]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0050]实施例一:
[0051]一种网页标签文本定位方法,该方法的操作场景如图1所示,该场景包含用户和电子设备,其中电子设备可以为台式计算机、笔记本计算机、平板电脑、手机、车载终端等具备显示屏蔽的终端。用户使用电子设备的浏览器可以打开网页,在网页上执行操作。图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页标签文本定位方法,其特征在于,包括:响应于用户操作网页产生网页事件时,向网页DOM树中插入事件监控器;响应于用户操作网页控件时,于网页DOM树中定位当前操作控件所在结点;基于当前操作控件所在结点查找包含有效文本信息的结点;响应于查找到包含有效文本信息的结点后,将结点信息及标签发送至指定位置。2.根据权利要求1所述的网页标签文本定位方法,其特征在于,所述有效文本信息的判断标准为汉字数量不超过十个,且字符中间没有其他非文本字符串。3.根据权利要求2所述的网页标签文本定位方法,其特征在于,基于当前操作控件所在结点查找包含有效文本信息的结点,包括:获取当前操作控件所在结点在当前层级的序号N;基于序号N的数值大小进行结点查找,包括:响应于序号N大于零时,获取同一层级节点序号为N

1的结点;响应于序号N为零时,获取当前操作控件所在结点的父结点;基于当前操作控件所在结点的父结点在上一层级获取所述父结点的层级序号N,并重复结点查找过程;响应于结点不包含有效文本信息时,跳过该结点继续向前查找;响应于查找到包含有效文本信息的结点时,结束查找。4.根据权利要求2所述的网页标签文本定位方法,其特征在于,基于当前操作控件所在结点查找包含有效文本信息的结点,包括:获取当前操作控件所在结点在当前层级的序号N和位置;基于序号N的数值大小进行结点查找,包括:响应于序号N大于零时,获取同一层级节点序号为N

1的结点;响应于序号N为零时,获取当前操作控件...

【专利技术属性】
技术研发人员:唐琦松林平吴鑫靳志业张磊
申请(专利权)人:上海艺赛旗软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1