事件检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34386777 阅读:19 留言:0更新日期:2022-08-03 21:10
本申请涉及一种事件检测方法、装置、计算机设备和存储介质。所述方法包括:获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵,构建类型感知注意力网络,根据编码嵌入矩阵和类型嵌入矩阵,构建图神经网络,根据事件样本集对类型感知注意力网络和所述图神经网络进行训练,利用训练好的类型感知注意力网络和图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属类型。采用本方法能够避免对触发词的依赖,解决了目前事件检测任务依赖触发词来识别和分类事件、触发词的标注费时费力的问题。发词的标注费时费力的问题。发词的标注费时费力的问题。

【技术实现步骤摘要】
事件检测方法、装置、计算机设备和存储介质


[0001]本申请涉及事件抽取
,特别是涉及一种事件检测方法、装置、计算机设备和存储介质。

技术介绍

[0002]事件检测是自然语言处理的重要课题之一。现有的事件检测方法需要在训练数据中添加带注释的触发器和事件类型。然而,触发器对于事件检测来说并不重要,注释者从给定的句子中,尤其是从一个长句中,挑出“最清晰”的单词是很费时的。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种事件检测方法、装置、计算机设备和存储介质。
[0004]一种事件检测方法,所述方法包括:
[0005]获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0006]构建类型感知注意力网络;所述感知注意力网络包括:LSTM层以及注意力层;所述LSTM网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0007]根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0008]根据所述事件样本集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属类型。
[0009]在其中一个实施例中,还包括:根据所述编码嵌入矩阵和所述类型嵌入矩阵,得到注意力分数矩阵为:
[0010][0011]其中,α
k
表示第k个分词的注意力得分,表示第k个分词在所述编码嵌入矩阵的编码表示,表示类型T在所述类型嵌入矩阵的嵌入表示。
[0012]在其中一个实施例中,还包括:根据所述注意力得分矩阵和所述编码嵌入矩阵,得到文本语料的表示形式为:
[0013][0014]其中,H表示编码嵌入矩阵。
[0015]在其中一个实施例中,还包括:根据所述编码嵌入矩阵和所述类型嵌入矩阵,构建图神经网络为:
[0016]V
l+1
=f(V
l
,A)=δ(AV
l
W
l
)
[0017]其中,V∈R
n*m
表示节点,A∈R
n*n
表示邻接矩阵,δ(.)表示激活函数,l表示网络的层数,W表示网络参数。
[0018]在其中一个实施例中,还包括:获取所述待检测文本的类型嵌入向量;将所述类型嵌入向量输入图神经网络。
[0019]在其中一个实施例中,还包括:利用训练好的所述类型感知注意力网络对待检测文本进行编码嵌入,得到待检测编码嵌入矩阵;根据所述待检测编码嵌入矩阵中每个单词的编码嵌入向量和所述第一类型嵌入向量,得到注意力得分矩阵;根据所述注意力得分矩阵和所述待检测编码嵌入矩阵,得到待检测文本的第一表达形式。
[0020]在其中一个实施例中,还包括:利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理,得到待检测文本的表达形式、待检测编码嵌入矩阵和第二类型嵌入矩阵;
[0021]根据待检测编码嵌入矩阵和第二类型嵌入矩阵,得到待检测文本的第二表达形式;
[0022]将所述第一表达形式和所述第二表达形式融合后输入多分类器,得到待检测文本的所属事件分类。
[0023]一种事件检测装置,所述装置包括:
[0024]数据获取模块,用于所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0025]类型感知模块,用于构建类型感知注意力网络;所述感知注意力网络包括:LSTM层以及注意力层;所述LSTM网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0026]图神经网络模块,用于根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0027]分类模块,用于根据所述事件样本集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0028]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0029]获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0030]构建类型感知注意力网络;所述感知注意力网络包括:LSTM层以及注意力层;所述
LSTM网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0031]根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0032]根据所述事件样本数据集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。
[0033]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0034]获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;
[0035]构建类型感知注意力网络;所述感知注意力网络包括:LSTM层以及注意力层;所述LSTM网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;
[0036]根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;
[0037]根据所述事件样本数据集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件检测方法,其特征在于,所述方法包括:获取事件样本数据集,对预先设置的事件类型进行嵌入,得到类型嵌入矩阵;所述类型嵌入矩阵包括:第一类型嵌入矩阵和第二类型嵌入矩阵;所述第一类型嵌入矩阵是根据事件样本中的隐藏触发词嵌入得到的,所述第二类型嵌入矩阵是根据事件样本中所有单词编码得到的;构建类型感知注意力网络;所述感知注意力网络包括:LSTM层以及注意力层;所述LSTM网络对输入的文本语料进行编码嵌入,得到编码嵌入矩阵;所述注意力层根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵;根据所述编码嵌入矩阵和所述第二类型嵌入矩阵,构建图神经网络;所述图神经网络中的节点为类型嵌入向量,节点相连的边表示事件之间的关联性;根据所述事件样本数据集对所述类型感知注意力网络和所述图神经网络进行训练,利用训练好的所述类型感知注意力网络和所述图神经网络对待检测文本进行处理后,由分类器输出待检测文本的所属事件类型。2.根据权利要求1所述的方法,其特征在于,根据所述编码嵌入矩阵和所述类型嵌入矩阵,得到注意力分数矩阵,包括:根据所述编码嵌入矩阵和所述第一类型嵌入矩阵,得到注意力分数矩阵为:其中,α
k
表示第k个分词的注意力得分,表示第k个分词在所述编码嵌入矩阵的编码表示,表示事件类型T在所述第一类型嵌入矩阵的嵌入表示。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述注意力得分矩阵和所述编码嵌入矩阵,得到文本语料的表示形式为:其中,H表示编码嵌入矩阵。4.根据权利要求1所述的方法,其特征在于,根据所述编码嵌入矩阵和所述类型嵌入矩阵,构建图神经网络,包括:根据所述编码嵌入矩阵和所述类型嵌入矩阵,构建图神经网络为:V
l+1
=f(V
l
,A)=δ(AV
l
W
l
)其中,V∈R
n*m
表示节点,A∈R
n*n
表示邻接矩阵,δ(.)表示激活函数,l表示网络的层数,W表示网络参数。5.根据权利要求1至4任一项所述的方法,其特征在于,利用训练好的所述图神经网络对待检测文本进行处理,包括:获取所述待检测文本的类型嵌入向量;将所述类型嵌入向量输入图神...

【专利技术属性】
技术研发人员:丁鲲刘姗姗张骁雄蒋国权张慧刘茗刘浏
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1