一种基于上下文和图注意力的事件抽取方法技术

技术编号：35734657 阅读：18 留言：0更新日期：2022-11-26 18:36

本发明专利技术涉及自然语言处理领域，尤其涉及一种基于上下文和图注意力的事件抽取方法，包括事件检测和事件论元抽取两大步骤。事件检测中，对预处理后的文本进行事件检测，判断出事件触发词和事件类型，所述事件检测模型提取句子间上下文特征；事件论元抽取中，基于获取的事件触发词和事件类型，通过图神经网络进行编码得到句法依赖信息，获取事件类型和论元信息。本发明专利技术的事件抽取方法整体性能高、召回率高、效率高。效率高。效率高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于上下文和图注意力的事件抽取方法

[0001]本专利技术涉及自然语言处理领域，尤其涉及一种基于上下文和图注意力的事件抽取方法，能够从文本中抽取事件信息，包括事件类型信息和事件论元信息。

技术介绍

[0002]传感器种类复杂、分布零散、产生的数据量巨大，传统的信息组织和管理方式已经无法适用，知识图谱作为一种新的信息组织方式，能够组织和表达各种实体以及实体之间的复杂关系，在组织和管理信息上具备天然的优势。事件抽取技术能够从文本中抽取事件信息，是构建事件知识图谱的关键技术之一。
[0003]目前事件抽取研究主要关注模型整体性能(F1值)的提升，缺少结合实际问题对模型特定性能指标的关注，也忽视了对模型效率的要求。事件抽取面向的是网络文本信息，具有以下两个特点，其一：网络文本规模巨大，但大量文本中不包含目标事件信息，导致事件信息稀疏，而事件信息价值又十分巨大，这就要求模型应该尽可能全、尽可能多地挖掘和抽取出目标事件信息，而可以容许其中存在一定的误判；其二：网络信息变化迅速，可能出现新的事件类型和新的语言表述方式，模型需要能迅速地适应变化，及时进行完善和更新。针对传感器的文本信息的以上两个特点，事件抽取模型必须满足以下两个要求，其一：在保证模型整体性能(F1值)的前提下，更加关注召回率(查全率)的提升；其二：模型效率要高，即训练速度快、需要计算资源、语料资源少。当前通用的事件抽取模型无法完全满足上述要求，无法胜任事件抽取任务。

技术实现思路

[0004]针对现有问题，本专利技术提出了一种基于上下文和...

【技术保护点】

【技术特征摘要】
1.一种基于上下文和图注意力的事件抽取方法，其特征在于，包括如下步骤：S1：事件检测，对预处理后的文本进行事件检测，判断出事件触发词和事件类型，所述事件检测模型提取句子间上下文特征；S2：事件论元抽取，基于所述步骤S1中获取的事件触发词和事件类型，通过图神经网络进行编码得到句法依赖信息，获取事件类型和论元信息。2.根据权利要求1所述的事件抽取方法，其特征在于，步骤S1包括：S101：文本预处理，对文本进行分句、分词、词性标注、命名实体识别、句法依存分析，将文本转化为格式统一的词嵌入矩阵，得到句法依赖树；S102：根据S101中所述句法依赖树构建句法图，采用双向长短时记忆力网络和多阶图注意力网络提取句子内文本特征，得到句子内信息嵌入；S103：使用词嵌入矩阵表示句子间上下文特征，得到句子间上下文嵌入；S104：将所述句子内信息嵌入与所述句子间上下文嵌入连接，得到最终嵌入h
i,sentCtx
＝[h
i
,h
i_sentCtx
]，其中h
i
代表第i个句子的自身嵌入信息，h
i_sentCtx
代表这句话的上下文嵌入；S105：将S104得到的最终嵌入输入全连接层后，输入softmax分类器，输出事件触发词和事件类型。3.根据权利要求2所述的事件抽取方法，其特征在于，步骤S103具体包括：将当前句子的上下文句子分别记作为Sentpre和Sentnext，根据词嵌入矩阵获取上下文句子中每个词的嵌入表示，得到上下文句子嵌入序列分别为：W
pre
＝[w1,w2,
…
,w
n
]表示前一个句子的句子内信息嵌入表示，其中w1,w2,
…
,w
n
表示句子中的n个单词，W
next
＝[w
′1,w
′2,
…
,w
′
m
]表示后一个句子的句子内信息嵌入表示，其中w
′1,w
′2,
…
,w
′
m
表示句子中的m个单词；用上一句和下一句话的词嵌入序列的平均值作为上下文句子的句嵌入，分别为：前一个句子的平均信息嵌入其中h
pre,i
表示前一个句子的每个单词的嵌入表示，N
pre
表示前一个句子的单词数量，后一个句子的平均信息嵌入其中h
next,i
表示下一个句子的每个单词的嵌入表示，N
next
表示下一句话的单词数量，将二者拼接得到句子间上下文嵌入4.根据权利要求3所述的事件抽取方法，其特征在于，步骤S2具体包括：S201：将当前句子输入预训练语言模型中，得到词嵌入矩阵、词性嵌入矩阵、实体嵌入矩阵、位置嵌入矩阵，并借助于Stanford Core NLP工具包得到句法依赖树，并且根据步骤S1判断出的事件触发词得到事件触发词在当前句子中所处位置；S202：将步骤S201中得到的词嵌入矩阵、位置嵌入矩阵、词性嵌入矩阵、实体类型嵌入矩阵作为双向长短时记忆网络BiLSTM的输入，根据步骤...

【专利技术属性】
技术研发人员：王衍洋，唐文忠，孙书玮，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人