【技术实现步骤摘要】
事件抽取模型训练方法及装置、事件抽取方法及装置
[0001]本公开涉及知识图谱、深度学习等人工智能
,尤其涉及一种事件抽取模型训练方法及装置、事件抽取方法及装置。
技术介绍
[0002]事件抽取,指的是将需要的事件的信息从非结构化的文本中提取出来,整合成结构化的形式。
[0003]目前,事件抽取通常是通过事件抽取模型实现的,而因为标注信息不充分,就会导致事件抽取模型的准确性较差。
技术实现思路
[0004]本公开提供了一种事件抽取模型训练方法及装置、事件抽取方法及装置。
[0005]根据本公开的第一方面,提供了一种事件抽取模型训练方法,包括:
[0006]获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
[0007]通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0008]获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
[0009]通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
[0010]基于所述第一子模型和所述第二子模型确定
【技术保护点】
【技术特征摘要】
1.一种事件抽取模型训练方法,包括:获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;基于所述第一子模型和所述第二子模型确定事件抽取模型。2.根据权利要求1所述的方法,其中,通过所述第一训练样本进行模型训练得到第一子模型,包括:通过待训练的所述第一子模型对所述第一样本文本进行处理得到第一预测数据,所述第一预测数据中包括多个预测论元、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型;根据所述第一标注数据和所述第一预测数据,更新所述第一子模型的模型参数。3.根据权利要求2所述的方法,其中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置;根据所述第一标注数据和所述第一预测数据,更新所述第一子模型的模型参数,包括:根据所述第一标注数据、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型,确定第一损失;根据所述多个预测论元的预测位置和所述多个预测论元在所述第一样本文本中的实际位置,确定第二损失;根据所述第一损失和所述第二损失,更新所述第一子模型的模型参数。4.根据权利要求3所述的方法,其中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置的概率;根据所述多个预测论元的预测位置和所述多个预测论元在所述第一样本文本中的实际位置,确定第二损失,包括:将所述多个预测论元进行分组,得到多组预测论元,每组预测论元中的论元相同;根据所述多个预测论元在所述第一样本文本中的预测位置的概率,分别在所述多组预测论元中确定目标预测论元,其中,在一组预测论元中的目标预测论元在所述第一样本文本中的预测位置的概率最高;根据所述目标论元的预测位置和所述目标论元在所述第一样本文本中的实际位置,确定所述第二损失。5.根据权利要求1
‑
4任一项所述的方法,其中,通过所述第二训练样本进行模型训练得到第二子模型,包括:通过待训练的所述第二子模型对所述第二样本文本和所述多个第二样本论元进行处
理,得到至少一个预测事件,所述预测事件中包括至少一个预测论元;根据所述预测事件中的预测论元和所述样本事件中的第二样本论元,确定第三损失;根据所述第三损失更新所述第二子模型的模型参数。6.根据权利要求5所述的方法,其中,通过待训练的所述第二子模型对所述第二样本文本和所述多个第二样本论元进行处理,得到至少一个预测事件,包括:根据所述第二样本文本,确定中心论元;在所述第二样本文本中确定所述中心论元对应的目标窗口,所述目标窗口中包括预设数量的字符;确定所述目标窗口中存在的多个第一论元,并获取所述多个第一论元与所述中心论元对应于同一事件的预测概率;根据所述中心论元、各所述第一论元以及各所述第一论元对应的预测概率,确定至少一个预测事件。7.根据权利要求6所述的方法,其中,在所述第二样本文本中确定所述中心论元对应的目标窗口,包括:在所述第二样本文本中确定多个待选窗口,所述待选窗口中包括所述预设数量的字符,所述待选窗口中包括所述待选中心角色对应的论元;确定所述待选窗口中包括的第一事件类型对应的论元的数量,所述第一事件类型为所述中心论元对应的事件类型;根据所述待选窗口中包括的第一事件类型对应的论元的数量,确定所述目标窗口。8.根据权利要求7所述的方法,其中,根据所述待选窗口中包括的第一事件类型对应的论元的数量,确定所述目标窗口,包括:将包括的第一事件类型对应的论元的数量最多的待选窗口确定为所述目标窗口。9.根据权利要求6
‑
8任一项所述的方法,其中,根据所述第二样本文本,确定中心论元,包括:确定所述多个第二样本论元对应的多个第二样本角色;确定各所述第二样本角色下的第二样本论元对应同一个事件的第一概率;根据各所述第二样本角色的召回率和准确率,确定各所述第二样本角色的角色系数;根据所述各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,在所述多个第二样本角色中确定所述待选中心角色;将所述待选中心角色对应的论元确定为所述中心论元。10.根据权利要求9所述的方法,其中,针对任意一个第二样本角色;根据所述第二样本角色的召回率和准确率,确定所述第二样本角色的角色系数,包括:根据预设函数处理所述第二样本角色的召回率和准确率,得到所述第二样本角色的角色系数。11.根据权利要求9或10所述的方法,其中,根据所述各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,在所述多个第二样本角色中确定所述待选中心角色,包括:根据各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,确定各所述第二样本角色的优先级;
根据各所述第二样本角色的优先级,在所述多个第二样本角色中确定所述待选中心角色。12.根据权利要求11所述的方法,其中,针对任意一个第二样本角色;根据各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,确定各所述第二样本角色的优先级,包括:将所述第二样本角色对应一个事件的第一概率,与所述第二样本角色的角色系数的乘积,确定为各所述第二样本角色的优先级。13.根据权利要求11或12所述的方法,其中,根据各所述第二样本角色的优先级,在所述多个第二样本角色中确定所述待选中心角色,包括:若所述多个第二样本角色中存在第二样本角色的优先级大于或等于预设阈值,则将优先级大于或等于预设阈值的第二样本角色确定为所述待选中心角色;若所述多个第二样本角色的优先级均小于所述预设阈值,则将所述多个第二样本角色中优先级最大的第二样本角色确定为所述待选中心角色。14.根据权利要求6
‑
13任一项所述的方法,其中,所述根据所述中心论元、各所述第一论元以及各所述第一论元对应的预测概率,确定至少一个预测事件,包括:根据各所述第一论元对应的预测概率,将对应的所述预测概率大于或等于概率阈值的第一论元确定为目标论元;确定所述中心论元对应的预测事件,其中,所述预测事件中包括所述中心论元和所述目标论元。15.一种事件抽取方法,包括:获取待处理的第一文本;通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;通过所述预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。16.根据权利要求15所述的方法,其中,所述通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元,包括:获取所述第一输出结果中的各个论元;将所述各个论元以及所述第一文本输入至所述第二子模型,以使得所述第二子模型输出所述第一文本中存在的事件、所述事件对应的论元。17.一种事件抽取模型训练装置,包括:获取模...
【专利技术属性】
技术研发人员:徐国进,韩翠云,李心雨,黄佳艳,裴明,施茜,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。