结合RPA和AI的事件抽取方法及装置制造方法及图纸

技术编号:31814157 阅读:12 留言:0更新日期:2022-01-08 11:17
本申请公开了一种结合RPA和AI的事件抽取方法及装置。其中,该事件抽取方法包括:获取文档;根据所述文档生成候选问题集合,所述候选问题集合中包括至少一个候选问题;将所述文档和所述候选问题输入至阅读理解模型中,以生成候选答案和所述候选答案的概率;根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果。由此,可通过一个适用于各种类型的事件抽取的阅读理解模型,进行不同类型的事件抽取结果的生成,降低了训练模型和采集训练数据的负担,节省了大量的人力物力,且能更好地扩展到新的事件,有助于提升事件抽取的效率。有助于提升事件抽取的效率。有助于提升事件抽取的效率。

【技术实现步骤摘要】
结合RPA和AI的事件抽取方法及装置


[0001]本申请涉及机器人流程自动化(Robotic Process Automation,RPA)、AI(Artificial Intelligence,人工智能)
,特别涉及一种结合RPA和AI的事件抽取方法及装置。

技术介绍

[0002]机器人流程自动化(Robotic Process Automation,RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]目前,RPA和AI技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。随着RPA机器人的广泛应用,越来越多的人力工作由RPA机器人进行接管。
[0005]相关技术中,在采用深度学习模型对事件进行抽取时,每种事件类型都有不同的模型和训练数据,需要事先对每种事件类型的训练数据进行大量的数据标注并进行模型训练,增加了训练模型和采集训练数据的负担,需要耗费较大的人力物力,且在新增加事件之后也不方便对模型进行扩展,事件抽取的效率较低。

技术实现思路

[0006]本申请旨在至少在一定程度上解决上述技术中的技术问题之一。
[0007]为此,本申请的一个目的在于提出一种结合RPA和AI的事件抽取方法,可通过一个适用于各种类型的事件抽取的阅读理解模型,进行不同类型的事件抽取结果的生成,降低了训练模型和采集训练数据的负担,节省了大量的人力物力,且能更好地扩展到新的事件,有助于提升事件抽取的效率。
[0008]本申请的第二个目的在于提出一种结合RPA和AI的事件抽取装置。
[0009]本申请的第三个目的在于提出一种电子设备。
[0010]本申请的第四个目的在于提出一种计算机可读存储介质。
[0011]为达到上述目的,本申请第一方面实施例提出了一种结合RPA和AI的事件抽取方法,包括:获取文档;根据所述文档生成候选问题集合,所述候选问题集合中包括至少一个候选问题;将所述文档和所述候选问题输入至阅读理解模型中,以生成候选答案和所述候选答案的概率;根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果。
[0012]本申请实施例的结合RPA和AI的事件抽取方法,可根据文档生成包括至少一个候选问题的候选问题集合,并将候选问题和文档输入至阅读理解模型中生成候选答案和候选答案的概率,并根据概率最高的候选答案和候选问题生成事件抽取结果。由此,可通过一个适用于各种类型的事件抽取的阅读理解模型,进行不同类型的事件抽取结果的生成,降低了训练模型和采集训练数据的负担,节省了大量的人力物力,且能更好地扩展到新的事件,有助于提升事件抽取的效率。
[0013]另外,根据本申请上述实施例提出的结合RPA和AI的事件抽取方法还可以具有如下附加的技术特征:在本申请的一个实施例中,所述根据所述文档生成候选问题集合,包括:根据所述文档获取对应的提示句型集合,所述提示句型集合中包括至少一个提示句型;根据所述文档生成实体词集合,所述实体词集合中包括至少一个实体词;根据所述提示句型集合和所述实体词集合生成所述候选问题集合。
[0014]在本申请的一个实施例中,所述根据所述文档获取对应的提示句型集合,包括:基于自然语言处理NLP识别所述文档的类型;根据所述类型获取对应的所述提示句型集合。
[0015]在本申请的一个实施例中,所述事件抽取方法还包括:获取所述类型的样本文档、所述样本文档的样本问题和样本答案;根据所述样本文档和所述样本答案生成样本实体词集合,所述样本实体词集合中包括至少一个样本实体词;将所述样本问题中的所述样本实体词替换为空白分隔符,以得到所述提示句型集合中的所述提示句型。
[0016]在本申请的一个实施例中,所述根据所述样本文档和所述样本答案生成样本实体词集合,包括:对所述样本文档和所述样本答案进行词语划分,以生成多个样本分词;对所述多个样本分词进行实体词筛选,以得到至少一个样本实体词;根据所述至少一个样本实体词生成所述样本实体词集合。
[0017]在本申请的一个实施例中,所述根据所述文档生成实体词集合,包括:对所述文档进行词语划分,以生成多个分词;对所述多个分词进行实体词筛选,以得到至少一个实体词;根据所述至少一个实体词生成所述实体词集合。
[0018]在本申请的一个实施例中,所述根据所述提示句型集合和所述实体词集合生成所述候选问题集合,包括:根据所述提示句型集合中的任意一个所述提示句型和所述实体词集合任意一个所述实体词,生成所述候选问题;根据至少一个所述候选问题生成所述候选问题集合。
[0019]在本申请的一个实施例中,所述根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果,包括:将所述概率最高的所述候选答案确定为目标答案;将所述目标答案对应的所述候选问题确定为目标问题;根据所述目标答案和所述目标问题生成所述事件抽取结果。
[0020]为达到上述目的,本申请第二方面实施例提出了一种结合RPA和AI的事件抽取装置,包括:获取模块,用于获取文档;第一生成模块,用于根据所述文档生成候选问题集合,所述候选问题集合中包括至少一个候选问题;输入模块,用于将所述文档和所述候选问题输入至阅读理解模型中,以生成候选答案和所述候选答案的概率;第二生成模块,用于根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果。
[0021]本申请实施例的结合RPA和AI的事件抽取装置,可根据文档生成包括至少一个候选问题的候选问题集合,并将候选问题和文档输入至阅读理解模型中生成候选答案和候选答案的概率,并根据概率最高的候选答案和候选问题生成事件抽取结果。由此,可通过一个适用于各种类型的事件抽取的阅读理解模型,进行不同类型的事件抽取结果的生成,降低了训练模型和采集训练数据的负担,节省了大量的人力物力,且能更好地扩展到新的事件,有助于提升事件抽取的效率。
[0022]另外,根据本申请上述实施例提出的结合RPA和AI的事件抽取装置还可以具有如
下附加的技术特征:在本申请的一个实施例中,所述第一生成模块,具体用于:根据所述文档获取对应的提示句型集合,所述提示句型集合中包括至少一个提示句型;根据所述文档生成实体词集合,所述实体词集合中包括至少一个实体词;根据所述提示句型集合和所述实体词集合生成所述候选问题集合。
[0023]在本申请的一个实施例中,所述第一生成模块,具体用于:基于自然语言处理NLP识别所述文档的类型;根据所述类型获取对应的所述提示句型集合。
[0024]在本申请的一个实施例中,所述第一生成模块,还用于:获取所述类型的样本文档、所述样本文档的样本问题和样本答案;根据所述样本文档和所述样本答案生成样本实体词集合,所述样本实体词集合中包括至少一个样本实体词;将所述样本问题中的所述样本实体词替换为空白本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合机器人流程自动化RPA和人工智能AI的事件抽取方法,其特征在于,包括:获取文档;根据所述文档生成候选问题集合,所述候选问题集合中包括至少一个候选问题;将所述文档和所述候选问题输入至阅读理解模型中,以生成候选答案和所述候选答案的概率;根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果。2.根据权利要求1所述的事件抽取方法,其特征在于,所述根据所述文档生成候选问题集合,包括:根据所述文档获取对应的提示句型集合,所述提示句型集合中包括至少一个提示句型;根据所述文档生成实体词集合,所述实体词集合中包括至少一个实体词;根据所述提示句型集合和所述实体词集合生成所述候选问题集合。3.根据权利要求2所述的事件抽取方法,其特征在于,所述根据所述文档获取对应的提示句型集合,包括:基于自然语言处理NLP识别所述文档的类型;根据所述类型获取对应的所述提示句型集合。4.根据权利要求3所述的事件抽取方法,其特征在于,还包括:获取所述类型的样本文档、所述样本文档的样本问题和样本答案;根据所述样本文档和所述样本答案生成样本实体词集合,所述样本实体词集合中包括至少一个样本实体词;将所述样本问题中的所述样本实体词替换为空白分隔符,以得到所述提示句型集合中的所述提示句型。5.根据权利要求4所述的事件抽取方法,其特征在于,所述根据所述样本文档和所述样本答案生成样本实体词集合,包括:对所述样本文档和所述样本答案进行词语划分,以生成多个样本分词;对所述多个样本分词进行实体词筛选,以得到至少一个样本实体词;根据所述至少一个样本实体词生成所述样本实体词集合。6.根据权利要求2所述的事件抽取方法,其特征在于,所述根据所述文档生成实体词集合,包括:对所述文档进行词语划分,以生成多个分词;对所述多个分词进行实体词筛选,以得到至少一个实体词;根据所述至少一个实体词生成所述实体词集合。7.根据权利要求2所述的事件抽取方法,其特征在于,所述根据所述提示句型集合和所述实体词集合生成所述候选问题集合,包括:根据所述提示句型集合中的任意一个所述提示句型和所述实体词集合任意一个所述实体词,生成所述候选问题;根据至少一个所述候选问题生成所述候选问题集合。8.根据权利要求1所述的事件抽取方法,其特征在于,所述根据所述概率最高的所述候选答案和所述候选问题生成事件抽取结果,包括:
将所述概率最高...

【专利技术属性】
技术研发人员:张原汪冠春胡一川褚瑞李玮
申请(专利权)人:来也科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1