RPA系统中基于自然语言处理的流程差错控制方法和系统技术方案

技术编号:29967695 阅读:17 留言:0更新日期:2021-09-08 09:38
本发明专利技术公开了一种RPA系统中基于自然语言处理的流程差错控制方法,包括如下步骤:获取RPA流程信息,将获得的RPA流程信息输入训练好的RPA流程差错检测模型,以得到RPA流程差错信息列表,根据得到的RPA流程差错信息列表执行流程差错控制。本发明专利技术通过将NLP与RPA流程差错检测环节之中,可极大地提高差错检测的准确率和效率,从而实现了RPA机器人自动化处理和人工辅助有效结合,减少了企业的人力、物力、财力的消耗,也节约了RPA项目的开发成本。也节约了RPA项目的开发成本。也节约了RPA项目的开发成本。

【技术实现步骤摘要】
RPA系统中基于自然语言处理的流程差错控制方法和系统


[0001]本专利技术属于自然语言处理
,更具体地,涉及一种RPA系统中基于自然语言处理的流程差错控制方法和系统。

技术介绍

[0002]自然语言处理(Natural Language Processing,简称NLP)是计算机科学,信息工程和人工智能的子领域,涉及计算机与人类(自然)语言之间的交互,特别是如何对计算机进行编程以处理和分析大量自然语言数据,最终达到教会计算机如何以人类的方式理解问题并让其给出适当回应的技术。
[0003]机器人流程自动化(Robotic process automation,简称RPA)系统是一种应用程序,它通过模仿最终用户在电脑的手动操作方式,通过事先编好的操作流程步骤,实现RPA机器人流程自动化;RPA就像一位机器人员工,能自动操作整个业务流程,不但速度快,而且几乎不出错、7*24完成重复的流程工作。
[0004]传统RPA机器人在处理丰富的活动场景流程中总会遇到未知的故障,一旦RPA机器人遇到故障停止运行时,只能等待维护人每天定时的登录系统来判断RPA是否出现故障,并且人工进行故障监控的方法需要人工重复性地对故障信息记录逐条进行监控。通过上述的传统人工方式检测RPA流程故障信息,不仅效率低,而且无法规避人工操作带来的误判,导致人力物力的浪费,因此自动化流程差错机制在RPA系统中尤为重要。
[0005]现有的RPA自动化流程差错检测方法有很多种,但这些RPA流程差错检测机制均存在一些共同的缺陷:第一、整个获取RPA流程信息步骤繁琐、成本高、耗时长;第二,在面对处理较大的数据量场景中,这些机制并不能精确地且高效地检测到RPA流程差错信息。

技术实现思路

[0006]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种RPA系统中基于自然语言处理的流程差错控制方法和系统,其目的在于,解决现有RPA自动化流程差错检测方法存在的获取RPA流程信息步骤繁琐、成本高、耗时长的技术问题,以及在面对处理较大的数据量场景中,无法精确且高效地检测到RPA流程差错信息的技术问题。
[0007]为实现上述目的,按照本专利技术的一个方面,提供了一种RPA系统中基于自然语言处理的流程差错控制方法,包括如下步骤:
[0008](1)获取RPA流程信息;
[0009](2)将步骤(1)获得的RPA流程信息输入训练好的RPA流程差错检测模型,以得到RPA流程差错信息列表。
[0010](3)根据步骤(2)得到的RPA流程差错信息列表执行流程差错控制。
[0011]优选地,RPA流程差错检测模型是双向长短时记忆网络BiLSTM、卷积神经网络CNN、或Transformer类预训练模型;
[0012]当RPA流程差错检测模型采用Transformer类预训练模型时,其包括electra

small模型和Chinese

electra

small模型。
[0013]优选地,步骤(2)中的RPA流程差错检测模型是通过以下步骤训练得到的:
[0014](2

1)获取RPA系统中的活动场景、及其对应的文本,对文本先后进行筛选、分类和整合处理,以得到文本语料库,其中文本分为正常信息文本和差错信息文本;
[0015](2

2)对步骤(2

1)得到的文本语料库进行预处理和标注处理,以得到RPA标注语料库;
[0016](2

3)对步骤(2

2)得到的RPA标注语料库先后进行数据增强和数据扩充处理,以得到RPA专用语料库;
[0017](2

4)将步骤(2

3)得到的RPA专用语料库划分为训练集、验证集以及测试集;
[0018](2

5)将步骤(2

4)得到的训练集和验证集输入RPA流程差错检测模型进行迭代训练,直至RPA流程差错检测模型收敛为止,并利用步骤(2

4)得到的测试集对RPA流程差错检测模型进行验证处理,直到得到RPA流程差错检测模型的检测精度达到最优为止,从而得到训练好的RPA流程差错检测模型。
[0019]优选地,步骤(2

1)首先是获取RPA系统中的活动场景、及其对应的文本,然后将这些文本进行筛选、分类和整合处理,以得到文本语料库。
[0020]正常信息文本指的是其机器情感偏向是机器情感正向或机器情感中性的文本;
[0021]差错信息文本指的是其机器情感偏向是机器情感负向的文本。
[0022]优选地,步骤(2

2)首先是使用正则表达式对文本语料库中的每个待标注文本进行数据清洗,以去除特殊符号;然后使用自然语言处理工具包NLTK对去除了特殊符号后的每个待标注文本进行处理,以去除其中的停用词并修正其中的单词表示;最后对处理后的待标注文本进行分类标注,所有分类标注后得到的文本构成RPA标注语料库;其中在分类标注过程中,是将正常信息文本标注为1,将差错信息文本标注为0。
[0023]优选地,步骤(2

3)包括以下子步骤:
[0024](2
‑3‑
1)对步骤(2

2)得到的RPA标注语料库中的每个文本进行近义词扩充处理,所有扩充处理后的文本构成第一语料库;
[0025](2
‑3‑
2)将步骤(2
‑3‑
1)得到的第一语料库进行数据复制处理,以得到第二语料库;
[0026](2
‑3‑
3)将步骤(2
‑3‑
2)得到的第二语料库中的每个差错信息文本进行反义词扩展处理,以得到第三语料库;
[0027](2
‑3‑
4)对步骤(2
‑3‑
3)得到的第三语料库中的差错信息文本进行机器情感调和处理,以得到RPA专用语料库;
[0028]优选地,步骤(2
‑3‑
1)具体是针对标注语料库中的每个文本而言,将文本中的每个句子进行分词处理,并对得到的每个词进行近义词扩展,从而得到每个句子对应的多个扩展后的词,进而得到近义词扩展后的文本,所有近义词扩展后的文本构成第一语料库;
[0029]步骤(2
‑3‑
2)具体是针对第一语料库中差错信息文本中每个句子中每个无法被第一网络模型检测出其语义的动词和名词而言,对该动词和名词进行复制处理并进行标注,从而得到数据复制后的文本,所有数据复制后的差错信息文本、以及第一语料库中原有的所有正常信息文本共同构成第二语料库;
[0030]步骤(2
‑3‑
3)具体是针对第二语料库中的差错信息文本而言,将文本中的每个句
子进行分词处理,并对处理得到的每个词进行反本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,包括如下步骤:(1)获取RPA流程信息;(2)将步骤(1)获得的RPA流程信息输入训练好的RPA流程差错检测模型,以得到RPA流程差错信息列表。(3)根据步骤(2)得到的RPA流程差错信息列表执行流程差错控制。2.根据权利要求1所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,RPA流程差错检测模型是双向长短时记忆网络BiLSTM、卷积神经网络CNN、或Transformer类预训练模型;当RPA流程差错检测模型采用Transformer类预训练模型时,其包括electra

small模型和Chinese

electra

small模型。3.根据权利要求2所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2)中的RPA流程差错检测模型是通过以下步骤训练得到的:(2

1)获取RPA系统中的活动场景、及其对应的文本,对文本先后进行筛选、分类和整合处理,以得到文本语料库,其中文本分为正常信息文本和差错信息文本;(2

2)对步骤(2

1)得到的文本语料库进行预处理和标注处理,以得到RPA标注语料库;(2

3)对步骤(2

2)得到的RPA标注语料库先后进行数据增强和数据扩充处理,以得到RPA专用语料库;(2

4)将步骤(2

3)得到的RPA专用语料库划分为训练集、验证集以及测试集;(2

5)将步骤(2

4)得到的训练集和验证集输入RPA流程差错检测模型进行迭代训练,直至RPA流程差错检测模型收敛为止,并利用步骤(2

4)得到的测试集对RPA流程差错检测模型进行验证处理,直到得到RPA流程差错检测模型的检测精度达到最优为止,从而得到训练好的RPA流程差错检测模型。4.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2

1)首先是获取RPA系统中的活动场景、及其对应的文本,然后将这些文本进行筛选、分类和整合处理,以得到文本语料库。正常信息文本指的是其机器情感偏向是机器情感正向或机器情感中性的文本;差错信息文本指的是其机器情感偏向是机器情感负向的文本。5.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2

2)首先是使用正则表达式对文本语料库中的每个待标注文本进行数据清洗,以去除特殊符号;然后使用自然语言处理工具包NLTK对去除了特殊符号后的每个待标注文本进行处理,以去除其中的停用词并修正其中的单词表示;最后对处理后的待标注文本进行分类标注,所有分类标注后得到的文本构成RPA标注语料库;其中在分类标注过程中,是将正常信息文本标注为1,将差错信息文本标注为0。6.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2

3)包括以下子步骤:(2
‑3‑
1)对步骤(2

2)得到的RPA标注语料库中的每个文本进行近义词扩充处理,所有
扩充处理后的文本构成第一语料库;(2
‑3‑
2)将步骤(2
‑3‑
1)得到的第一语料库进行数据复制处理,以得到第二语料库;(2
‑3‑
3)将步骤(2
‑3‑
2)得到的第二语料库中的每个差错信息文本进行反义词扩展处理,以得到第三语料库;(2
‑3‑
4)对步骤(2
‑3‑
3)得到的第三语料库中的差...

【专利技术属性】
技术研发人员:蔡宇辉李肯立刘双翼杨圣洪秦云川吴帆
申请(专利权)人:中电金信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1