【技术实现步骤摘要】
事件抽取方法、装置、智能终端及存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及的是一种事件抽取方法、装置、智能终端及存储介质。
技术介绍
[0002]随着科学技术的发展,自然语言处理技术得到了广泛的应用,事件抽取的应用也越来越广泛。事件是指在某个特定时间片段和地域范围内发生的由一个或多个角色参与并且由一个或多个动作组成的一件事情,一般是句子级的。通过事件抽取可以对事件进行结构化,结构化的目标是确定事件所属的事件类型,并提取该事件参与者。
[0003]现有技术中,进行事件抽取时依赖于预先设置的触发词。现有技术的问题在于,缺少对于句子本身的事件类型信息的关注,而设置的触发词不一定与句子完全对应,不利于提高事件抽取的准确性。
[0004]因此,现有技术还有待改进和发展。
技术实现思路
[0005]本专利技术的主要目的在于提供一种事件抽取方法、装置、智能终端及存储介质,旨在解决现有技术中事件抽取过程中依赖于预先设置的触发词,缺少对于句子本身的事件类型信息的关注,而设置的触发词不一定与 ...
【技术保护点】
【技术特征摘要】
1.一种事件抽取方法,其特征在于,所述事件抽取方法包括:获取待抽取语句,对所述待抽取语句中的每个词语进行词编码和位置编码,得到所述待抽取语句对应的词嵌入向量和位置嵌入向量;将所述词嵌入向量和所述位置嵌入向量相加以获得第一输入向量,将所述第一输入向量输入预先训练的编码器,通过所述编码器输出所述待抽取语句的语境化表达向量;将所述语境化表达向量输入预先训练的多标签事件类型分类器,通过所述多标签事件类型分类器确定所述待抽取语句对应的事件类型嵌入向量,根据所述事件类型嵌入向量获取所述待抽取语句对应的事件类型综合向量;将所述语境化表达向量和所述事件类型综合向量相加以获得第二输入向量,将所述第二输入向量输入预先训练的事件论元分类器,通过所述事件论元分类器获取所述待抽取语句对应的事件论元;根据所述事件论元构建论元组合,对各所述论元组合进行事件归类并确定各所述论元组合对应的目标事件类型,其中,一个所述论元组合对应的目标事件类型为非事件或所述待抽取语句对应的事件类型中的任意一种。2.根据权利要求1所述的事件抽取方法,其特征在于,所述待抽取语句与多个事件类型对应,所述事件类型综合向量的维度与所述语境化表达向量的维度相同,所述将所述语境化表达向量输入预先训练的多标签事件类型分类器,通过所述多标签事件类型分类器确定所述待抽取语句对应的事件类型嵌入向量,根据所述事件类型嵌入向量获取所述待抽取语句对应的事件类型综合向量,包括:将所述语境化表达向量输入预先训练的多标签事件类型分类器,通过所述多标签事件类型分类器确定所述待抽取语句对应的事件类型嵌入向量;根据所述事件类型嵌入向量获取所述待抽取语句对应的事件类型综合向量。3.根据权利要求2所述的事件抽取方法,其特征在于,所述根据所述事件类型嵌入向量获取所述待抽取语句对应的事件类型综合向量,包括:获取各所述事件类型对应的事件概率,其中,所述事件概率是通过所述多标签事件类型分类器确定所述待抽取语句对应的事件类型嵌入向量时确定的;将事件概率大于预设的概率阈值的事件类型作为待处理事件类型,并将所述待处理事件类型对应的事件类型嵌入向量作为待处理嵌入向量;将各所述待处理事件类型对应的待处理嵌入向量进行加权求和以获得所述事件类型综合向量,其中,各所述待处理嵌入向量对应的权重系数相等,或者将各所述待处理事件类型对应的事件概率作为各所述待处理事件类型对应的待处理嵌入向量的权重系数。4.根据权利要求2所述的事件抽取方法,其特征在于,所述根据所述事件类型嵌入向量获取所述待抽取语句对应的事件类型综合向量,包括:获取权重矩阵、投影矩阵和事件类型嵌入矩阵,其中,所述事件类型嵌入矩阵根据所述事件类型嵌入向量获得,所述权重矩阵是一个m行1列的矩阵,所述投影矩阵和所述事件类型嵌入矩阵都为m行d列的矩阵,m为所述待抽取语句对应的事件类型的个数,d为所述事件类型嵌入向量的维度;根据所述权重矩阵、所述投影矩阵、所述事件类型嵌入矩阵和所述语境化表达向量计算获取所述待抽取语句对应的事件类型综合向量;
其中,所述权重矩阵...
【专利技术属性】
技术研发人员:杨海钦,叶俊鹏,
申请(专利权)人:粤港澳大湾区数字经济研究院福田,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。