【技术实现步骤摘要】
基于AI和RPA的公文文件处理方法、装置、设备和介质
[0001]本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,尤其涉及一种基于AI和RPA的公文文件处理方法、装置、设备和介质。
技术介绍
[0002]RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]相关技术中,通过人工阅读公文文件,来实现对公文文件进行审核并纠错。然而人工审核的方式,不仅效率较低,而且还易出错。
技术实现思路
[0005]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本公开提出一种基于AI和RPA的公文文件处理方法、装置、设备和介质,以实现通过RPA机器人自动对公文文件的公文内容进行审核,可以降低审核难度及人工参与量,提高公文文件的审核效率,提升公文文件审核的时效性和准确性。并且,通过RPA机器人对公文文件进行审核,可以释放人力资源,降低人力成本。此外,在目标语句与源语句存在差异的情况下,根据差异生成并发送提示信息,可以提醒相关人员根据差异对公文文件中的源语句进行修改,提高公文文件的准确性,提升该方法的灵活性和适用性。
[0007]本公开第一方面实施例提出了一种基于AI和RPA的公文文件处理方法,包括:< ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能AI和机器人流程自动化RPA的公文文件处理方法,其特征在于,包括:控制RPA机器人获取公文文件,并对所述公文文件进行字符识别,以得到公文内容;针对所述公文内容中的任意一个源语句,控制所述RPA机器人获取与所述源语句语义匹配的至少一个候选语句;控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,以及确定各所述候选语句中多个词语之间的第二匹配度;控制所述RPA机器人根据所述源语句的第一匹配度和各所述候选语句对应的第二匹配度,从所述源语句与各所述候选语句中确定目标语句;在所述目标语句和所述源语句存在差异的情况下,控制所述RPA机器人根据所述差异,生成并发送所述源语句对应的第一提示信息,其中,所述第一提示信息用于提示根据所述差异对所述公文文件中的所述源语句进行修改。2.根据权利要求1所述的方法,其特征在于,所述控制所述RPA机器人确定所述源语句中多个词语之间的第一匹配度,包括:控制所述RPA机器人基于自然语言处理NLP技术,对所述源语句进行分词处理,得到所述源语句中的各子词;针对各所述子词中的任意一个目标子词,控制所述RPA机器人根据所述源语句中位于所述目标子词之前的各候选子词,确定所述目标子词的条件概率,或者,根据设定子词,确定所述目标子词的条件概率;控制所述RPA机器人根据各所述子词的条件概率,确定所述源语句的第一匹配度。3.根据权利要求1所述的方法,其特征在于,所述控制RPA机器人获取与所述源语句语义匹配的至少一个候选语句,包括:控制所述RPA机器人根据预设短语库和/或预设词典,生成与所述源语句语义匹配的至少一个候选语句;和/或,控制所述RPA机器人从预设公文语料库中,获取与所述源语句语义匹配的至少一个候选语句;和/或,控制所述RPA机器人从修改例句库中,获取与所述源语句语义匹配的至少一个候选语句。4.根据权利要求3所述的方法,其特征在于,所述控制RPA机器人获取与所述源语句语义匹配的至少一个候选语句之后,所述方法还包括:控制所述RPA机器人以所述源语句为中心,从所述公文内容中截取设定窗口长度内的目标文本信息;基于所述目标文本信息,确定所述源语句与各所述候选语句之间的相似度;根据各所述候选语句的相似度,筛选并保留所述相似度高于设定相似度阈值的所述候选语句。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标文本信息,确定所述源语句与各所述候选语句之间的相似度,包括:
针对任意一个所述候选语句,确定所述候选语句与所述目标文本信息中各语句之间的关联度;从所述目标文本信息中的各语句中,确定关联度高于设定关联度阈值的关联语句;基于所述关联语句,确定所述源语句与所述候选语句之间的相似度。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:控制所述RPA机器人识别所述公文内容的目标公文要素;根据预设参考公文要素和所述目标公文要素,确定所述公文内容中是否存在缺失的公文要素;响应于所述公文内容中存在缺失的公文要素,生成并发送第二提示信息,其中,所述第二提示信息,用于提示所述公文文件中缺失的公文要素。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:控制所述RPA机器人识别所述公文内容的错误类型,其中,所述错误类型包括:字词错误、标点使用错误、序号使用错误、字体使用错误、字号使用错误、段落格式错误、重复类型错误、排序不当、语句不通、用词不当、语录引用错误和附件标题错误中...
【专利技术属性】
技术研发人员:张翼,
申请(专利权)人:来也科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。