一种事件抽取方法及相关装置制造方法及图纸

技术编号:33210212 阅读:31 留言:0更新日期:2022-04-24 01:04
本申请公开了一种事件抽取方法及相关装置,方法包括获取待抽取语句对应的事件类型;对待抽取语句中的每个词语进行词编码和位置编码,得到待抽取语句对应的词嵌入向量和位置嵌入向量;将词嵌入向量、位置嵌入向量及事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量,并基于目标嵌入向量抽取各事件类型各自对应的事件参数。本申请通过将语句的词嵌入向量、位置嵌入向量及事件类型对应的事件类型嵌入向量相加来得到目标嵌入向量,再基于目标嵌入向量确定各事件类型的事件论元,将事件类型作为指示信息与语句信息融合,提高目标嵌入向量所携带的语义信息,从而可以提高事件参数的抽取精确度。数的抽取精确度。数的抽取精确度。

【技术实现步骤摘要】
一种事件抽取方法及相关装置


[0001]本申请涉及自然语言处理
,特别涉及一种事件抽取方法及相关装置。

技术介绍

[0002]随着人工智能和深度神经网络的发展,自然语言处理技术得到了广泛的应用,其中,自然语言处理技术中的事件抽取可以自动对网络媒体上每日生成的原生事件进行结构化。事件是指在某个特定的时间片段和地域范围内发生的,由一个或多个角色参与,由一个或多个动作组成的一件事情,事件一般为句子级的。结构化的目标是确定事件所属的事件类型,并提取事件的事件论元,例如,参与者、相关实体、相关时间以及相关数值等。然而,由于语言文字的复杂性和多样性,一个语句中可能会涉及多个事件,然而现有的事件抽取方法普遍是需要触发词来进行事件抽取,缺少对事件类型信息的关注,从而影响抽取到的事件论元的准确性。
[0003]因而现有技术还有待改进和提高。

技术实现思路

[0004]本申请要解决的技术问题在于,针对现有技术的不足,提供一种事件抽取方法及相关装置。
[0005]为了解决上述技术问题,本申请实施例第一方面提供了一种事件抽取方法,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法,其特征在于,所述的方法包括:获取待抽取语句对应的事件类型;对所述待抽取语句中的每个词语进行词编码和位置编码,得到所述待抽取语句对应的词嵌入向量和位置嵌入向量;将所述词嵌入向量、所述位置嵌入向量以及所述事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量,并基于所述目标嵌入向量抽取事件类型对应的事件参数。2.根据权利要求1所述事件抽取方法,其特征在于,所述获取待抽取语句对应的事件类型具体包括:对所述待抽取语句中的每个词语进行词编码和位置编码,得到所述待抽取语句对应的词嵌入向量和位置嵌入向量;将所述词嵌入向量与所述位置嵌入向量相加以得到输入向量;将所述输入向量输入预先训练的事件分类模型中的事件类型编码器,通过所述事件类型编码器输出所述待抽取语句的第一语境化表达;将所述语境化表示输入所述事件分类模型中的事件类型分类器,通过所述事件类型分类器确定所述待抽取语句对应的事件类型。3.根据权利要求1所述事件抽取方法,其特征在于,所述待抽取语句中的各词语对应的词向量的向量维度和位置向量的向量维度均等于事件类型嵌入向量的向量维度,其中,待抽取语句对应的事件类型包括多个事件类型时,多个事件类型中的各事件类型对应的事件类型嵌入向量的向量维度均相等。4.根据权利要求1所述事件抽取方法,其特征在于,所述待抽取语句对应的事件类型包括多个事件类型,所述将所述词嵌入向量、所述位置嵌入向量以及所述事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量,并基于所述目标嵌入向量抽取事件类型对应的事件参数具体包括:对于每个事件类型,分别将所述词嵌入向量的各词向量、所述位置嵌入向量中与各词向量对应的位置向量以及所述事件类型的事件类型嵌入向量进行逐点相加,以得到目标嵌入向量;基于注意力机制将所述目标嵌入向量进行信息融合,以得到第二语境化表达;基于所述第二语境化表达,确定所述目标嵌入向量对应的事件论元,并基于确定的事件论元获取事件类型对应的事件参数。5.根据权利要求1所述事件抽取方法,其特征在于,所述待抽取语句对应的事件类型包括多个事件类型,所述将所述词嵌入向量、所述位置嵌入向量以及所述事件类型对应的事件类型嵌入向量相加以得到目标嵌入向量,并基于所述目标嵌入向量抽取事件类型对应的事件参数具体包括:将多个事件类型中的各事件类型对应的事件类型嵌入向量加权,以得到目标事件类型嵌入向量;分别将所述词嵌入向量的各词向量、所述位置嵌入向量中与各词向量对应的位置向量以及所述目标事件类型嵌入向量进行逐点相加,以得到目标嵌入向量;基于注意力机制将所述目标嵌入向量进行信息融合,以得到第二语境化表达;基于所述第二语境化表达,确定所述目标嵌入向量对应的事件论元,并基于确定的事
件论元获取各事件类型各自对应的事件参数。6.根据权利要求5所述事件抽取方法,其特征在于,所述将多个事件类型中的各事件类型各自对应的事件类型嵌入向量加权,以得到目标事件类型嵌入向量具体包括:获取各事件类型各自对应的事件概率,其中,所述事件概率为获取待抽取语句对应的事件类型时确定的;将各事件类型各自对应的事件概率作为各事件类型对应的事...

【专利技术属性】
技术研发人员:杨海钦叶俊鹏柳昊良
申请(专利权)人:粤港澳大湾区数字经济研究院福田
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1