RPA系统中基于自然语言处理的流程差错控制方法和系统技术方案

技术编号：29967695 阅读：17 留言：0更新日期：2021-09-08 09:38

本发明专利技术公开了一种RPA系统中基于自然语言处理的流程差错控制方法，包括如下步骤：获取RPA流程信息，将获得的RPA流程信息输入训练好的RPA流程差错检测模型，以得到RPA流程差错信息列表，根据得到的RPA流程差错信息列表执行流程差错控制。本发明专利技术通过将NLP与RPA流程差错检测环节之中，可极大地提高差错检测的准确率和效率，从而实现了RPA机器人自动化处理和人工辅助有效结合，减少了企业的人力、物力、财力的消耗，也节约了RPA项目的开发成本。也节约了RPA项目的开发成本。也节约了RPA项目的开发成本。

全部详细技术资料下载

【技术实现步骤摘要】
RPA系统中基于自然语言处理的流程差错控制方法和系统

[0001]本专利技术属于自然语言处理
，更具体地，涉及一种RPA系统中基于自然语言处理的流程差错控制方法和系统。

技术介绍

[0002]自然语言处理(Natural Language Processing，简称NLP)是计算机科学，信息工程和人工智能的子领域，涉及计算机与人类(自然)语言之间的交互，特别是如何对计算机进行编程以处理和分析大量自然语言数据，最终达到教会计算机如何以人类的方式理解问题并让其给出适当回应的技术。
[0003]机器人流程自动化(Robotic process automation，简称RPA)系统是一种应用程序，它通过模仿最终用户在电脑的手动操作方式，通过事先编好的操作流程步骤，实现RPA机器人流程自动化；RPA就像一位机器人员工，能自动操作整个业务流程，不但速度快，而且几乎不出错、7*24完成重复的流程工作。
[0004]传统RPA机器人在处理丰富的活动场景流程中总会遇到未知的故障，一旦RPA机器人遇到故障停止运行时，只能等待维护人每天定时的登录系统来判断RPA是否出现故障，并且人工进行故障监控的方法需要人工重复性地对故障信息记录逐条进行监控。通过上述的传统人工方式检测RPA流程故障信息，不仅效率低，而且无法规避人工操作带来的误判，导致人力物力的浪费，因此自动化流程差错机制在RPA系统中尤为重要。
[0005]现有的RPA自动化流程差错检测方法有很多种，但这些RPA流程差错检测机制均存在一些共同的缺陷：第一...

【技术保护点】

【技术特征摘要】
1.一种RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，包括如下步骤：(1)获取RPA流程信息；(2)将步骤(1)获得的RPA流程信息输入训练好的RPA流程差错检测模型，以得到RPA流程差错信息列表。(3)根据步骤(2)得到的RPA流程差错信息列表执行流程差错控制。2.根据权利要求1所述的RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，RPA流程差错检测模型是双向长短时记忆网络BiLSTM、卷积神经网络CNN、或Transformer类预训练模型；当RPA流程差错检测模型采用Transformer类预训练模型时，其包括electra
‑
small模型和Chinese
‑
electra
‑
small模型。3.根据权利要求2所述的RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，步骤(2)中的RPA流程差错检测模型是通过以下步骤训练得到的：(2
‑
1)获取RPA系统中的活动场景、及其对应的文本，对文本先后进行筛选、分类和整合处理，以得到文本语料库，其中文本分为正常信息文本和差错信息文本；(2
‑
2)对步骤(2
‑
1)得到的文本语料库进行预处理和标注处理，以得到RPA标注语料库；(2
‑
3)对步骤(2
‑
2)得到的RPA标注语料库先后进行数据增强和数据扩充处理，以得到RPA专用语料库；(2
‑
4)将步骤(2
‑
3)得到的RPA专用语料库划分为训练集、验证集以及测试集；(2
‑
5)将步骤(2
‑
4)得到的训练集和验证集输入RPA流程差错检测模型进行迭代训练，直至RPA流程差错检测模型收敛为止，并利用步骤(2
‑
4)得到的测试集对RPA流程差错检测模型进行验证处理，直到得到RPA流程差错检测模型的检测精度达到最优为止，从而得到训练好的RPA流程差错检测模型。4.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，步骤(2
‑
1)首先是获取RPA系统中的活动场景、及其对应的文本，然后将这些文本进行筛选、分类和整合处理，以得到文本语料库。正常信息文本指的是其机器情感偏向是机器情感正向或机器情感中性的文本；差错信息文本指的是其机器情感偏向是机器情感负向的文本。5.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，步骤(2
‑
2)首先是使用正则表达式对文本语料库中的每个待标注文本进行数据清洗，以去除特殊符号；然后使用自然语言处理工具包NLTK对去除了特殊符号后的每个待标注文本进行处理，以去除其中的停用词并修正其中的单词表示；最后对处理后的待标注文本进行分类标注，所有分类标注后得到的文本构成RPA标注语料库；其中在分类标注过程中，是将正常信息文本标注为1，将差错信息文本标注为0。6.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法，其特征在于，步骤(2
‑
3)包括以下子步骤：(2
‑3‑
1)对步骤(2
‑
2)得到的RPA标注语料库中的每个文本进行近义词扩充处理，所有
扩充处理后的文本构成第一语料库；(2
‑3‑
2)将步骤(2
‑3‑
1)得到的第一语料库进行数据复制处理，以得到第二语料库；(2
‑3‑
3)将步骤(2
‑3‑
2)得到的第二语料库中的每个差错信息文本进行反义词扩展处理，以得到第三语料库；(2
‑3‑
4)对步骤(2
‑3‑
3)得到的第三语料库中的差...

【专利技术属性】
技术研发人员：蔡宇辉，李肯立，刘双翼，杨圣洪，秦云川，吴帆，
申请(专利权)人：中电金信软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人