基于AI和RPA的公文文件处理方法、装置、设备和介质制造方法及图纸

技术编号:33455455 阅读:38 留言:0更新日期:2022-05-19 00:38
本公开提出一种基于AI和RPA的公文文件处理方法、装置、设备和介质,涉及AI和RPA领域,其中,方法包括:控制RPA机器人对公文文件进行字符识别,以得到公文内容;针对公文内容中的任意一个源语句,获取与源语句语义匹配的至少一个候选语句;确定源语句中多个词语之间的第一匹配度,及各候选语句中多个词语之间的第二匹配度;根据第一匹配度和第二匹配度,从源语句与各候选语句中确定目标语句;在目标语句和源语句存在差异的情况下,控制RPA机器人根据差异,生成并发送源语句对应的第一提示信息,以提示对源语句进行修改。由此,通过RPA机器人自动对公文文件的公文内容进行审核,可降低审核难度及人工参与量,提高公文文件审核的时效性。性。性。

【技术实现步骤摘要】
基于AI和RPA的公文文件处理方法、装置、设备和介质


[0001]本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,尤其涉及一种基于AI和RPA的公文文件处理方法、装置、设备和介质。

技术介绍

[0002]RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]相关技术中,通过人工阅读公文文件,来实现对公文文件进行审核并纠错。然而人工审核的方式,不仅效率较低,而且还易出错。

技术实现思路

[0005]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本公开提出一种基于AI和RPA的公文文件处理方法、装置、设备和介质,以实现通过RPA机器人自动对公文文件的公文内容进行审核,可以降低审核难度及人工参与量,提高公文文件的审核效率,提升公文文件审核的时效性和准确性。并且,通过RPA机器人对公文文件进行审核,可以释放人力资源,降低人力成本。此外,在目标语句与源语句存在差异的情况下,根据差异生成并发送提示信息,可以提醒相关人员根据差异对公文文件中的源语句进行修改,提高公文文件的准确性,提升该方法的灵活性和适用性。
[0007]本公开第一方面实施例提出了一种基于AI和RPA的公文文件处理方法,包括:<br/>[0008]控制RPA机器人获取公文文件,并对所述公文文件进行字符识别,以得到公文内容;
[0009]针对所述公文内容中的任意一个源语句,控制所述RPA机器人获取与所述源语句语义匹配的至少一个候选语句;
[0010]控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,以及确定各所述候选语句中多个词语之间的第二匹配度;
[0011]控制所述RPA机器人根据所述源语句的第一匹配度和各所述候选语句对应的第二匹配度,从所述源语句与各所述候选语句中确定目标语句;
[0012]在所述目标语句和所述源语句存在差异的情况下,控制所述RPA机器人根据所述差异,生成并发送所述源语句对应的第一提示信息,其中,所述第一提示信息用于提示根据所述差异对所述公文文件中的所述源语句进行修改。
[0013]本公开第二方面实施例提出了一种基于AI和RPA的公文文件处理装置,包括:
[0014]第一识别模块,用于控制RPA机器人获取公文文件,并对所述公文文件进行字符识别,以得到公文内容;
[0015]第一获取模块,用于针对所述公文内容中的任意一个源语句,控制所述RPA机器人获取与所述源语句语义匹配的至少一个候选语句;
[0016]第一确定模块,用于控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,以及确定各所述候选语句中多个词语之间的第二匹配度;
[0017]第二确定模块,用于控制所述RPA机器人根据所述源语句的第一匹配度和各所述候选语句对应的第二匹配度,从所述源语句与各所述候选语句中确定目标语句;
[0018]第一处理模块,用于在所述目标语句和所述源语句存在差异的情况下,控制所述RPA机器人根据所述差异,生成并发送所述源语句对应的第一提示信息,其中,所述第一提示信息用于提示根据所述差异对所述公文文件中的所述源语句进行修改。
[0019]本公开第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如本公开上述第一方面实施例所述的方法。
[0020]本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本公开上述第一方面实施例所述的方法。
[0021]本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开上述第一方面实施例所述的方法。
[0022]本公开实施例所提供的技术方案包含如下的有益效果:
[0023]通过控制RPA机器人获取公文文件,并对公文文件进行字符识别,以得到公文内容;针对公文内容中的任意一个源语句,控制RPA机器人获取与源语句语义匹配的至少一个候选语句;控制RPA机器人确定源语句中多个词语之间的第一匹配度,以及确定各候选语句中多个词语之间的第二匹配度;控制RPA机器人根据源语句的第一匹配度和各候选语句对应的第二匹配度,从源语句与各候选语句中确定目标语句;在目标语句和源语句存在差异的情况下,控制RPA机器人根据差异,生成并发送源语句对应的第一提示信息,其中,第一提示信息用于提示根据差异对所述公文文件中的源语句进行修改。由此,可以实现通过RPA机器人自动对公文文件的公文内容进行审核,可以降低审核难度及人工参与量,提高公文文件的审核效率,提升公文文件审核的时效性和准确性。并且,通过RPA机器人对公文文件进行审核,可以释放人力资源,降低人力成本。此外,在目标语句与源语句存在差异的情况下,根据差异生成并发送提示信息,可以提醒相关人员根据差异对公文文件中的源语句进行修改,保证公文文件的准确性,提升该方法的灵活性和适用性。
[0024]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
[0025]本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0026]图1为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0027]图2为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0028]图3为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0029]图4为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0030]图5为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0031]图6为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的流程示意图;
[0032]图7为本公开实施例所提供的一种基于AI和RPA的公文文件处理方法的实现原理图;
[0033]图8为本公开实施例所提供的一种基于AI和RPA的公文文件处理装置的结构示意图;
[0034]图9示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
[0035]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
[0036]目前,公文文件处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能AI和机器人流程自动化RPA的公文文件处理方法,其特征在于,包括:控制RPA机器人获取公文文件,并对所述公文文件进行字符识别,以得到公文内容;针对所述公文内容中的任意一个源语句,控制所述RPA机器人获取与所述源语句语义匹配的至少一个候选语句;控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,以及确定各所述候选语句中多个词语之间的第二匹配度;控制所述RPA机器人根据所述源语句的第一匹配度和各所述候选语句对应的第二匹配度,从所述源语句与各所述候选语句中确定目标语句;在所述目标语句和所述源语句存在差异的情况下,控制所述RPA机器人根据所述差异,生成并发送所述源语句对应的第一提示信息,其中,所述第一提示信息用于提示根据所述差异对所述公文文件中的所述源语句进行修改。2.根据权利要求1所述的方法,其特征在于,所述控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,包括:控制所述RPA机器人基于自然语言处理NLP技术,对所述源语句进行分词处理,得到所述源语句中的各子词;针对各所述子词中的任意一个目标子词,控制所述RPA机器人根据所述源语句中位于所述目标子词之前的各候选子词,确定所述目标子词的条件概率,或者,根据设定子词,确定所述目标子词的条件概率;控制所述RPA机器人根据各所述子词的条件概率,确定所述源语句的第一匹配度。3.根据权利要求1所述的方法,其特征在于,所述控制RPA机器人获取与所述源语句语义匹配的至少一个候选语句,包括:控制所述RPA机器人根据预设短语库和/或预设词典,生成与所述源语句语义匹配的至少一个候选语句;和/或,控制所述RPA机器人从预设公文语料库中,获取与所述源语句语义匹配的至少一个候选语句;和/或,控制所述RPA机器人从修改例句库中,获取与所述源语句语义匹配的至少一个候选语句。4.根据权利要求3所述的方法,其特征在于,所述控制RPA机器人获取与所述源语句语义匹配的至少一个候选语句之后,所述方法还包括:控制所述RPA机器人以所述源语句为中心,从所述公文内容中截取设定窗口长度内的目标文本信息;基于所述目标文本信息,确定所述源语句与各所述候选语句之间的相似度;根据各所述候选语句的相似度,筛选并保留所述相似度高于设定相似度阈值的所述候选语句。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标文本信息,确定所述源语句与各所述候选语句之间的相似度,包括:
针对任意一个所述候选语句,确定所述候选语句与所述目标文本信息中各语句之间的关联度;从所述目标文本信息中的各语句中,确定关联度高于设定关联度阈值的关联语句;基于所述关联语句,确定所述源语句与所述候选语句之间的相似度。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:控制所述RPA机器人识别所述公文内容的目标公文要素;根据预设参考公文要素和所述目标公文要素,确定所述公文内容中是否存在缺失的公文要素;响应于所述公文内容中存在缺失的公文要素,生成并发送第二提示信息,其中,所述第二提示信息,用于提示所述公文文件中缺失的公文要素。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:控制所述RPA机器人识别所述公文内容的错误类型,其中,所述错误类型包括:字词错误、标点使用错误、序号使用错误、字体使用错误、字号使用错误、段落格式错误、重复类型错误、排序不当、语句不通、用词不当、语录引用错误和附件标题错误中...

【专利技术属性】
技术研发人员:张翼
申请(专利权)人:来也科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1