事件抽取模型训练方法及装置、事件抽取方法及装置制造方法及图纸

技术编号:33019988 阅读:12 留言:0更新日期:2022-04-15 08:52
本公开提供了一种事件抽取模型训练方法及装置,涉及知识图谱、深度学习等人工智能技术领域,具体实现方案为:获取第一训练样本,第一训练样本包括第一样本文本和第一标注数据。通过第一训练样本进行模型训练得到第一子模型。获取第二训练样本,第二训练样本中包括第二样本文本、第二样本文本中存在的多个第二样本论元、多个第二样本论元中每两个第二样本论元对应同一事件的样本概率。通过第二训练样本进行模型训练得到第二子模型。确定事件抽取模型包括第一子模型和第二子模型。本公开提供的技术方案可以有效的提升事件抽取模型的准确性。性。性。

【技术实现步骤摘要】
事件抽取模型训练方法及装置、事件抽取方法及装置


[0001]本公开涉及知识图谱、深度学习等人工智能
,尤其涉及一种事件抽取模型训练方法及装置、事件抽取方法及装置。

技术介绍

[0002]事件抽取,指的是将需要的事件的信息从非结构化的文本中提取出来,整合成结构化的形式。
[0003]目前,事件抽取通常是通过事件抽取模型实现的,而因为标注信息不充分,就会导致事件抽取模型的准确性较差。

技术实现思路

[0004]本公开提供了一种事件抽取模型训练方法及装置、事件抽取方法及装置。
[0005]根据本公开的第一方面,提供了一种事件抽取模型训练方法,包括:
[0006]获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
[0007]通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0008]获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
[0009]通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
[0010]基于所述第一子模型和所述第二子模型确定事件抽取模型。
[0011]根据本公开的第二方面,提供了一种事件抽取方法,包括:
[0012]获取待处理的第一文本;
[0013]通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0014]通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。
[0015]根据本公开的第三方面,提供了一种事件抽取模型训练装置,包括:
[0016]获取模块,用于获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
[0017]第一处理模块,用于通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0018]第二获取模块,用于获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
[0019]第二处理模块,用于通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
[0020]确定模块,用于基于所述第一子模型和所述第二子模型确定事件抽取模型。
[0021]根据本公开的第四方面,提供了一种事件抽取装置,包括:
[0022]获取模块,用于获取待处理的第一文本;
[0023]第一处理模块,用于通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0024]第二处理模块,用于通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。
[0025]根据本公开的第五方面,提供了一种电子设备,包括:
[0026]至少一个处理器;以及
[0027]与所述至少一个处理器通信连接的存储器;其中,
[0028]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或者第二方面所述的方法。
[0029]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面或者第二方面所述的方法。
[0030]根据本公开的第七方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或者第二方面所述的方法。
[0031]根据本公开的技术解决了事件抽取模型的准确性较差的问题。
[0032]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0033]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0034]图1为本公开实施例提供事件抽取的实现示意图;
[0035]图2为本公开实施例提供的事件抽取模型训练方法的流程图;
[0036]图3为本公开实施例提供的标注数据的实现示意图;
[0037]图4为本公开实施例提供的事件抽取模型训练方法的流程图二;
[0038]图5为本公开实施例提供的第一子模型的处理示意图;
[0039]图6为本公开实施例提供的更新第一子模型的模型参数的实现示意图;
[0040]图7为本公开实施例提供的事件抽取模型训练方法的流程图三;
[0041]图8为本公开实施例提供的确定第一概率的实现示意图;
[0042]图9为本公开实施例提供的确定待选窗口的实现示意图;
[0043]图10为本公开实施例提供的确定目标窗口的实现示意图;
[0044]图11为本公开实施例提供的事件抽取方法的流程图;
[0045]图12为本公开实施例提供的事件抽取方法的处理示意图;
[0046]图13为本公开实施例的事件抽取模型训练装置的结构示意图;
[0047]图14为本公开实施例的事件抽取装置的结构示意图;
[0048]图15是用来实现本公开实施例的事件抽取模型训练方法以及事件抽取方法的电子设备的框图。
具体实施方式
[0049]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0050]为了更好的理解本公开的技术方案,下面对本公开所涉及的相关技术进行进一步的详细介绍。...

【技术保护点】

【技术特征摘要】
1.一种事件抽取模型训练方法,包括:获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;基于所述第一子模型和所述第二子模型确定事件抽取模型。2.根据权利要求1所述的方法,其中,通过所述第一训练样本进行模型训练得到第一子模型,包括:通过待训练的所述第一子模型对所述第一样本文本进行处理得到第一预测数据,所述第一预测数据中包括多个预测论元、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型;根据所述第一标注数据和所述第一预测数据,更新所述第一子模型的模型参数。3.根据权利要求2所述的方法,其中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置;根据所述第一标注数据和所述第一预测数据,更新所述第一子模型的模型参数,包括:根据所述第一标注数据、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型,确定第一损失;根据所述多个预测论元的预测位置和所述多个预测论元在所述第一样本文本中的实际位置,确定第二损失;根据所述第一损失和所述第二损失,更新所述第一子模型的模型参数。4.根据权利要求3所述的方法,其中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置的概率;根据所述多个预测论元的预测位置和所述多个预测论元在所述第一样本文本中的实际位置,确定第二损失,包括:将所述多个预测论元进行分组,得到多组预测论元,每组预测论元中的论元相同;根据所述多个预测论元在所述第一样本文本中的预测位置的概率,分别在所述多组预测论元中确定目标预测论元,其中,在一组预测论元中的目标预测论元在所述第一样本文本中的预测位置的概率最高;根据所述目标论元的预测位置和所述目标论元在所述第一样本文本中的实际位置,确定所述第二损失。5.根据权利要求1

4任一项所述的方法,其中,通过所述第二训练样本进行模型训练得到第二子模型,包括:通过待训练的所述第二子模型对所述第二样本文本和所述多个第二样本论元进行处
理,得到至少一个预测事件,所述预测事件中包括至少一个预测论元;根据所述预测事件中的预测论元和所述样本事件中的第二样本论元,确定第三损失;根据所述第三损失更新所述第二子模型的模型参数。6.根据权利要求5所述的方法,其中,通过待训练的所述第二子模型对所述第二样本文本和所述多个第二样本论元进行处理,得到至少一个预测事件,包括:根据所述第二样本文本,确定中心论元;在所述第二样本文本中确定所述中心论元对应的目标窗口,所述目标窗口中包括预设数量的字符;确定所述目标窗口中存在的多个第一论元,并获取所述多个第一论元与所述中心论元对应于同一事件的预测概率;根据所述中心论元、各所述第一论元以及各所述第一论元对应的预测概率,确定至少一个预测事件。7.根据权利要求6所述的方法,其中,在所述第二样本文本中确定所述中心论元对应的目标窗口,包括:在所述第二样本文本中确定多个待选窗口,所述待选窗口中包括所述预设数量的字符,所述待选窗口中包括所述待选中心角色对应的论元;确定所述待选窗口中包括的第一事件类型对应的论元的数量,所述第一事件类型为所述中心论元对应的事件类型;根据所述待选窗口中包括的第一事件类型对应的论元的数量,确定所述目标窗口。8.根据权利要求7所述的方法,其中,根据所述待选窗口中包括的第一事件类型对应的论元的数量,确定所述目标窗口,包括:将包括的第一事件类型对应的论元的数量最多的待选窗口确定为所述目标窗口。9.根据权利要求6

8任一项所述的方法,其中,根据所述第二样本文本,确定中心论元,包括:确定所述多个第二样本论元对应的多个第二样本角色;确定各所述第二样本角色下的第二样本论元对应同一个事件的第一概率;根据各所述第二样本角色的召回率和准确率,确定各所述第二样本角色的角色系数;根据所述各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,在所述多个第二样本角色中确定所述待选中心角色;将所述待选中心角色对应的论元确定为所述中心论元。10.根据权利要求9所述的方法,其中,针对任意一个第二样本角色;根据所述第二样本角色的召回率和准确率,确定所述第二样本角色的角色系数,包括:根据预设函数处理所述第二样本角色的召回率和准确率,得到所述第二样本角色的角色系数。11.根据权利要求9或10所述的方法,其中,根据所述各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,在所述多个第二样本角色中确定所述待选中心角色,包括:根据各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,确定各所述第二样本角色的优先级;
根据各所述第二样本角色的优先级,在所述多个第二样本角色中确定所述待选中心角色。12.根据权利要求11所述的方法,其中,针对任意一个第二样本角色;根据各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,确定各所述第二样本角色的优先级,包括:将所述第二样本角色对应一个事件的第一概率,与所述第二样本角色的角色系数的乘积,确定为各所述第二样本角色的优先级。13.根据权利要求11或12所述的方法,其中,根据各所述第二样本角色的优先级,在所述多个第二样本角色中确定所述待选中心角色,包括:若所述多个第二样本角色中存在第二样本角色的优先级大于或等于预设阈值,则将优先级大于或等于预设阈值的第二样本角色确定为所述待选中心角色;若所述多个第二样本角色的优先级均小于所述预设阈值,则将所述多个第二样本角色中优先级最大的第二样本角色确定为所述待选中心角色。14.根据权利要求6

13任一项所述的方法,其中,所述根据所述中心论元、各所述第一论元以及各所述第一论元对应的预测概率,确定至少一个预测事件,包括:根据各所述第一论元对应的预测概率,将对应的所述预测概率大于或等于概率阈值的第一论元确定为目标论元;确定所述中心论元对应的预测事件,其中,所述预测事件中包括所述中心论元和所述目标论元。15.一种事件抽取方法,包括:获取待处理的第一文本;通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;通过所述预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。16.根据权利要求15所述的方法,其中,所述通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元,包括:获取所述第一输出结果中的各个论元;将所述各个论元以及所述第一文本输入至所述第二子模型,以使得所述第二子模型输出所述第一文本中存在的事件、所述事件对应的论元。17.一种事件抽取模型训练装置,包括:获取模...

【专利技术属性】
技术研发人员:徐国进韩翠云李心雨黄佳艳裴明施茜
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1