一种基于RPA机器人的商品展示页违禁词检查方法技术

技术编号:31496317 阅读:13 留言:0更新日期:2021-12-18 12:38
本发明专利技术公开了一种基于RPA机器人的商品展示页违禁词检查方法,包括在RPA机器人中通过指令编排搭建RPA应用流程;通过RPA应用流程在电商平台中对商品展示页违禁词检查:在RPA应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;去除无效数据和重复数据,形成检查表格;RPA应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;并下载详情页图片,再利用OCR技术识别下载详情页图片上文本内容,若存在违禁词则记录;根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果。本发明专利技术可以进行电商商品违禁词的检查,提高工作效率,降低人工成本。降低人工成本。降低人工成本。

【技术实现步骤摘要】
一种基于RPA机器人的商品展示页违禁词检查方法


[0001]本专利技术涉及RPA
,具体涉及一种基于RPA机器人的商品展示页违禁词检查方法。

技术介绍

[0002]机器人流程自动化(Robotic Process Automation)简称RPA,是通过机器人软件,模拟人在计算机上的操作,按规则自动执行流程任务。随着企业信息数据日益增多,促使企业对RPA产生了极大依赖,RPA产品通过模拟人对计算机的操作,不仅可以高效完成大量重复性工作,还可以高质量地实现大规模数据的处理,极大提高了办公效率。但对于用户而言,RPA流程的设计,开发依旧存在比较高的技术门槛,需要具备一定编程基础才能开发设计。目前,对RPA流程设计通常需要由专业的技术人员根据具体需求进行开发,各个子流程之间的衔接也需要用户手动配置,每个参数的确定也需要用户参与,对用户的专业程度要求较高,普通技术人员或流程运营人员难以进行RPA流程设计,极大的限制的RPA的应用发展。
[0003]电子商务实现了人们不出门就可以选购全世界范围内商品,因为商品无法近距离查看,只能通过网络在商品详情页查看该商品的相关介绍,此时商品详情页文字描述和商品图片就在其中扮演了重要角色。电商平台高销量的构成大部分来自于视觉冲击,图片和描述的重要性由此体现。在商品详情页的描述展示都属于广告范畴,有些特定的关键词属于广告规定的违禁词,是不能展示在商品描述中。当前电子商务平台众多,企业往往需要花费大量的人力用于检查这一项工作,因此急需一种基于RPA机器人检查各个平台商品描述是否存在广告违禁词的方法。

技术实现思路

[0004]本专利技术的目的在于,提供一种基于RPA机器人的商品展示页违禁词检查方法。本专利技术可以使用户通过RPA机器人来进行电商平台商品违禁词的检查,可以提高工作效率,降低人工成本。
[0005]为解决上述技术问题,本专利技术提供的技术方案如下:一种基于RPA机器人的商品展示页违禁词检查方法,包括:
[0006]在RPA机器人中通过指令编排搭建RPA应用流程;
[0007]通过RPA应用流程在电商平台中对商品展示页违禁词检查,包括:
[0008]步骤S1、在RPA应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;
[0009]步骤S2、去除违禁词和商品链接中的无效数据和重复数据,形成检查表格;
[0010]步骤S3、RPA应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;并下载详情页图片,再利用OCR技术识别下载详情页图片上文本内容,若存在违禁词则记录;
[0011]步骤S4、根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果。
[0012]上述的基于RPA机器人的商品展示页违禁词检查方法,步骤S1中,通过手动输入、复制粘贴或Excel批量导入进行输入商品链接以及自定义商品违禁词;
[0013]其中,所述手动输入是通过则双击表格单元,在表格单元出现输入光标后,输入对应的备注信息;
[0014]所述复制粘贴是通过在选中的单元格中粘贴所复制的内容或通过选择复制Excel内容进行粘贴,
[0015]所述Excel批量导入是通过弹出文件选择对话框,选择指定导入的Excel文件,并选择要导入的Sheet页,设置是否需要将第一行内容作为表头。
[0016]前述的基于RPA机器人的商品展示页违禁词检查方法,步骤S2中,去除违禁词和商品链接中的无效数据和重复数据,形成检查表格的过程具体是,
[0017]步骤S2.1、将电商平台的默认违禁词和自定义商品违禁词合并,去除重复的违禁词,形成违禁词变量;
[0018]步骤S2.2、读取用户输入的商品链接,去除重复的商品链接和为空的商品链接,形成商品链接数据;
[0019]步骤S2.3、将商品链接数据和违禁词变量写入数据表格,形成检查表格。
[0020]前述的基于RPA机器人的商品展示页违禁词检查方法,所述步骤S3的具体过程如下:
[0021]步骤S3.1、对检查表格进行行循环,从第一行循环遍历到最后一行;
[0022]步骤S3.2、循环遍历到一行数据,获取该行商品链接数据;
[0023]步骤S3.3、根据循环到的商品链接依次打开平台商品详情页,若检测到打开网页失败,记录失败原因,忽略本次循环,进行下一次循环;否则执行步骤S3.4;
[0024]步骤S3.4、获取商品详情页文本信息,并下载商品链接详情页的图片到本地;
[0025]步骤S3.5、循环商品详情页文本信息中是否存在违禁词,若存在则记录;
[0026]步骤S3.6、获取下载图片的尺寸大小;若图片高度大于2000dpi,则横向切割图片,将图片等比切割,生成图片列表,再执行步骤3.7;否则直接执行步骤3.7;
[0027]步骤S3.7、依次通过OCR技术识别图片文本内容;
[0028]步骤S3.8、基于步骤S3.7识别到的文本,循环检查图片文本内容本中是否存在违禁词,若存在则记录。
[0029]前述的基于RPA机器人的商品展示页违禁词检查方法,所述指令编排包括指令添加,指令编辑和指令折叠;
[0030]所述指令添加是将指令集列表中的指令添加到RPA机器人的流程设计器中;
[0031]所述指令编辑是对添加到流程设计器中的指令进行编辑;
[0032]所述指令折叠是将流程设计器中指定位置和数量的指令进行折叠,并添加注释,提高流程指令的管理效率。
[0033]前述的基于RPA机器人的商品展示页违禁词检查方法,所述指令添加具体实现如下:
[0034]A1、所述流程设计器检测到新增指令,判断指令新增的方式,如果是拖拽方式,则
执行步骤A2;如果是双击方式,则执行步骤A3;
[0035]A2、检测到为拖拽添加方式,获取鼠标拖拽的坐标位置,根据坐标得出最佳指令放置位置;
[0036]A3、检测到为双击添加方式,获取当前流程设计器中选中的流程所在位置,设置新增指令位置为选中位置加一;
[0037]A4、确定添加指令位置后,在流程设计器的指令列表中指定位置插入新增指令,再刷新指令列表;
[0038]A5、检测所添加的指令是否有参数需要配置,如果没有,添加完成;如果有,则执行步骤S6。
[0039]A6、弹出新增指令的参数配置界面,完成参数配置。
[0040]前述的基于RPA机器人的商品展示页违禁词检查方法,步骤A4中,在流程设计器的指令列表中指定位置插入新增指令,具体是,
[0041]A4.1、检测拖拽放置坐标处是否已有指令,如果没有,直接添加到当前流程设计器列表的最新位置,如果已有指令,执行A4.2;
[0042]A4.2、计算当前鼠标位置在这个已有指令界面上的相对坐标,如果相对坐标的y坐标小于指令界面高度的一半,即在这个指令界面的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RPA机器人的商品展示页违禁词检查方法,其特征在于:包括:在RPA机器人中通过指令编排搭建RPA应用流程;通过RPA应用流程在电商平台中对商品展示页违禁词检查,包括:步骤S1、在RPA应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;步骤S2、去除商品链接以及自定义商品违禁词中的无效数据和重复数据,形成检查表格;步骤S3、RPA应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;并下载详情页图片,再利用OCR技术识别下载详情页图片上文本内容,若存在违禁词则记录;步骤S4、根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果。2.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:步骤S1中,通过手动输入、复制粘贴或Excel批量导入进行输入商品链接以及自定义商品违禁词;其中,所述手动输入是通过则双击表格单元,在表格单元出现输入光标后,输入对应的备注信息;所述复制粘贴是通过在选中的单元格中粘贴所复制的内容或通过选择复制Excel内容进行粘贴,所述Excel批量导入是通过弹出文件选择对话框,选择指定导入的Excel文件,并选择要导入的Sheet页,设置是否需要将第一行内容作为表头。3.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:步骤S2中,去除自定义违禁词和商品链接中的无效数据和重复数据,形成检查表格的过程具体是,步骤S2.1、将电商平台的默认违禁词和自定义商品违禁词合并,去除重复的违禁词,形成违禁词变量;步骤S2.2、读取用户输入的商品链接,去除重复的商品链接和为空的商品链接,形成商品链接数据;步骤S2.3、将商品链接数据和违禁词变量写入数据表格,形成检查表格。4.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:所述步骤S3的具体过程如下:步骤S3.1、对检查表格进行行循环,从第一行循环遍历到最后一行;步骤S3.2、循环遍历到一行数据,获取该行商品链接数据;步骤S3.3、根据循环到的商品链接依次打开平台商品详情页,若检测到打开网页失败,记录失败原因,忽略本次循环,进行下一次循环;否则执行步骤S3.4;步骤S3.4、获取商品详情页文本信息,并下载商品链接详情页的图片到本地;步骤S3.5、循环商品详情页文本信息中是否存在违禁词,若存在则记录;步骤S3.6、获取下载图片的尺寸大小;若图片高度大于2000dpi,则横向切割图片,将图片等比切割,生成图片列表,再执行步骤3.7;否则直接执行步骤3.7;步骤S3.7、依次通过OCR技术识别图片文本内容;
步骤S3.8、基于步骤S3.7识别到的文本,循环检查图片文本内容本中是否存在违禁词,若存在则记录。5.根据权利要求1所述的基于RPA机器人的商品展示页违禁词检查方法,其特征在于:所述指令编排包括指令添加,指令编辑和指令折叠;所述指令添加是将指令集列表中的指令添加到RPA机器人的流程设计器中;所述指令编辑是对添加到流程设计器中的指令进行编辑;所述指令折叠是将流程设...

【专利技术属性】
技术研发人员:代培
申请(专利权)人:杭州分叉智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1