一种融合注意力机制与卷积神经网络的事件抽取方法技术

技术编号：37250689 阅读：28 留言：0更新日期：2023-04-20 23:29

本发明专利技术公开了一种融合注意力机制与卷积神经网络的事件抽取方法，其步骤包括：1)利用文本编码器对待提取文本内容进行特征表示，得到该待提取文本的分布式特征；2)利用特征提取器从所述分布式特征中提取该待提取文本的语境特征及词汇之间的关联信息；3)将该待提取文本的语境特征及词汇之间的关联信息输入事件触发词分类器，输出该待提取文本的事件触发词，然后基于该待提取文本的事件触发词确定该待提取文本的事件类型；4)事件元素分类器根据该待提取文本的事件类型、语境特征，对该待提取文本中每个分词依次进行判断是否为事件元素；5)使用元素角色分类器识别每一所述事件元素的角色类别。本发明专利技术大大提升了事件抽取的准确率且效率高。确率且效率高。确率且效率高。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合注意力机制与卷积神经网络的事件抽取方法

[0001]本专利技术属于自然语言处理领域的信息抽取技术，特别是，实现一种融合注意力机制与卷积神经网络的事件抽取方法。

技术介绍

[0002]信息抽取是从自然语言文本中抽取出特定的信息，从而将海量异构文本内容自动分类、提取和重构。信息抽取主要包括实体抽取、关系抽取、事件抽取，其中，事件抽取是将各种实体与关系高度结构化的抽取任务。事件抽取是从半结构、非结构化文本中，将目标相关的事件的重要论元识别出来，即通过获取事件触发词及事件相关论元信息，组织为事件信息，被广泛应用于语义搜索、情报分析、事件推理、风险预警、智能问答等领域。事件抽取任务分为事件识别与事件论元识别两部分，即发现事件触发词并确定事件类型、识别事件关键论元并确定论元角色。由于以事件为单位认识世界与解决问题更符合人类认知习惯，因此，事件抽取成为国内外工业界和学术界关注的热点。近年来，这些研究工作大部分是依赖深度学习来获取事件信息，目前，现有的事件抽取方法根据其使用的神经网络架构不同主要分为以下几类：
[0003](1)基于卷积神经网络的事件抽取，使用卷积神经网络诱导k
‑
grams信息，捕获局部语义特征，学习句子的组成语义特征，完成对事件信息的识别与抽取。这种方法可以处理多事件场景。但是，无法在不同上下文中编码词汇语义，若是想要获取更多的全局信息就需要层叠增大感受野。
[0004](2)基于循环神经网络的事件抽取，使用循环神经网络建模序列信息，捕获参数角色和触发词子类型之间的依赖关

【技术保护点】

【技术特征摘要】
1.一种融合注意力机制与卷积神经网络的事件抽取方法，其步骤包括：1)利用文本编码器对待提取文本内容进行特征表示，得到该待提取文本的分布式特征；2)利用特征提取器从所述分布式特征中提取该待提取文本的语境特征及词汇之间的关联信息；3)将该待提取文本的语境特征及词汇之间的关联信息输入事件触发词分类器，输出该待提取文本的事件触发词，然后基于该待提取文本的事件触发词确定该待提取文本的事件类型；4)事件元素分类器根据该待提取文本的事件类型、语境特征，对该待提取文本中每个分词依次进行判断是否为事件元素；5)使用元素角色分类器识别每一所述事件元素的角色类别。2.根据权利要求1所述的方法，其特征在于，得到该待提取文本的分布式特征的方法为：所述文本编码器根据该待提取文本生成文本序列S＝[x1,x2,x3,..,x
n
]，其中，n为该待提取文本中的分词数，x
i
为该待提取文本中的第i个分词；然后对文本序列S中每一分词分别生成一词嵌入向量、分割向量、位置向量，将文本序列S以词嵌入向量、分割向量、位置向量三者求和的方式转换为输入序列T＝(t1,t2,t3,..,t
n
)，t
n
表示第n个分词的词嵌入向量、分割向量和位置向量合并后的融合向量；将序列T＝(t1,t2,t3,..,t
n
)输入Transformer层通过自注意力函数获取词间关联并分配权重，得到融合上下文信息的特征向量；将所述融合上下文信息的特征向量输入预训练模型，得到序列E...

【专利技术属性】
技术研发人员：周永彬，周沁仪，林海伦，张倩，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人