一种事件论元抽取方法、装置以及电子设备制造方法及图纸

技术编号:24888873 阅读:24 留言:0更新日期:2020-07-14 18:16
本申请公开了一种事件论元抽取方法、装置以及电子设备,涉及知识图谱技术领域。具体实现方案为:获取待抽取事件内容;基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元;其中,所述已训练的事件论元抽取模型通过事件新闻标注数据以及所述事件新闻标注数据中标注的每个论元的权重对预训练模型训练得到。

【技术实现步骤摘要】
一种事件论元抽取方法、装置以及电子设备
本申请涉及计算机技术中的知识图谱
,尤其涉及一种事件论元抽取方法、装置以及电子设备。
技术介绍
事件论元抽取是指从事件描述中抽取事件的各个组成要素(时间、地点、参与者、事件适配的相关内容等),要素即为论元,每个论元对应一种论元角色,最终以结构化知识的形式展示给用户。目前,常采用的事件论元抽取模型是基于分类思路的,然而,不同事件类型的事件论元角色不同,通过目前简单分类模型进行论元抽取时,效果较差。
技术实现思路
本申请提供一种事件论元抽取方法、装置和电子设备,以解决事件论元抽取效果较差的问题。第一方面,本申请一个实施例提供一种事件论元抽取方法,包括:获取待抽取事件内容;基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元;其中,所述已训练的事件论元抽取模型通过事件新闻标注数据以及所述事件新闻标注数据中标注的每个论元的权重对预训练模型训练得到。本申请的实施例的事件论元抽取方法中,用于对待抽取事件本文档来自技高网...

【技术保护点】
1.一种事件论元抽取方法,其特征在于,所述方法包括:/n获取待抽取事件内容;/n基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元;/n其中,所述已训练的事件论元抽取模型通过事件新闻标注数据以及所述事件新闻标注数据中标注的每个论元的权重对预训练模型训练得到。/n

【技术特征摘要】
1.一种事件论元抽取方法,其特征在于,所述方法包括:
获取待抽取事件内容;
基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元;
其中,所述已训练的事件论元抽取模型通过事件新闻标注数据以及所述事件新闻标注数据中标注的每个论元的权重对预训练模型训练得到。


2.根据权利要求1所述的方法,其特征在于,通过以下至少方式得到所述已训练的事件论元抽取模型:
根据所述事件新闻标注数据以及损失函数对所述预训练模型进行训练,得到所述已训练的事件论元抽取模型,其中,所述损失函数与所述预训练模型对所述事件新闻标注数据中标注的每个论元的预测概率值以及所述每个论元的权重相关。


3.根据权利要求2所述的方法,其特征在于,所述损失函数为所述预训练模型对所述事件新闻标注数据中标注的每个论元的预测概率值的负对数似然的加权和。


4.根据权利要求1所述的方法,其特征在于,所述基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元,包括:
基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容中至少一个论元的预测概率值;
将所述至少一个论元中预测概率值最大的论元以及预测概率值大于概率阈值的论元作为所述目标论元;
其中,所述概率阈值为所述至少一个论元的预测概率值中最大的预测概率值乘以预设系数的值,预设系数为小于或等于1的正数。


5.根据权利要求2所述的方法,其特征在于,所述根据所述事件新闻标注数据以及损失函数对所述预训练模型进行训练,得到所述已训练的事件论元抽取模型,包括:
根据预设问答格式,对所述事件新闻标注数据进行格式转换,得到新闻问答数据;
根据所述新闻问答数据以及所述损失函数对所述预训练模型进行训练,得到所述已训练的事件论元抽取模型。


6.根据权利要求1所述的方法,其特征在于,所述基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件内容的目标论元,包括:
通过已训练的事件类型分类模型预测所述待抽取事件内容的事件类型;
通过已训练的事件句判别模型预测所述待抽取事件内容的事件描述句;
基于所述事件类型、所述事件描述句、所述事件类型对应的论元角色以及预设问答格式,构建所述待抽取事件内容对应的待抽问答数据,其中,所述待抽问答数据的格式与所述预设问答格式匹配,所述待抽问答数据包括所述待抽取事件内容的事件描述句、所述待抽取事件内容的事件类型以及所述事件类型对应的论元角色;
将所述待抽问答数据输入所述已训练的论元抽取模型,通过所述已训练的事件论元抽取模型进行论元抽取,获得所述目标论元。


7.一种事件论元抽取装置,其特征在于,所述装置包括:
第一获取模块,用于获取待抽取事件内容;
抽取模块,用于基于已训练的事件论元抽取模型对所述待抽取事件内容进行论元抽取,得到所述待抽取事件...

【专利技术属性】
技术研发人员:李法远陈玉光潘禄刘远圳韩翠云施茜黄佳艳
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1