一种基于多层级图网络的事件联合抽取方法及装置制造方法及图纸

技术编号:28035443 阅读:34 留言:0更新日期:2021-04-09 23:17
本发明专利技术提供一种基于多层级图网络的事件联合抽取方法及装置,方法包括:对输入的至少一个句子进行编码,基于编码后句子的依存句法树构建句子级的图网络,融入邻居节点代表的词的特征信息到当前词的特征信息中得到当前词新的特征信息,再根据不同句子之间的共现特征运算获取上下文句子的全局信息,将上下文句子的全局信息与当前词新的特征信息进行融合,基于融合了上下文句子的全局信息与当前词新的特征信息的词,识别事件触发词,根据触发词识别事件要素,对事件触发词和事件要素进行联合抽取。通过本发明专利技术的基于多层级图网络的事件联合抽取方法及装置,能够实现对触发词和事件要素的精准联合抽取。

【技术实现步骤摘要】
一种基于多层级图网络的事件联合抽取方法及装置
本专利技术涉及深度学习和自然语言处理
,尤其涉及一种基于多层级图网络的事件联合抽取方法及装置、电子设备、存储介质。
技术介绍
信息抽取是自然语言处理的基础任务,事件抽取作为其中的一个分支,具有极大的应用潜能。事件抽取分为事件触发词识别和事件要素识别两个子任务,触发词识别是检测出句子中最能代表事件发生的词,事件要素识别是提取出句子中事件发生的时间、地点、参与者等要素。事件抽取是信息抽取的重要组成部分,从非结构化的文本中抽取出用户感兴趣的事件,然后用结构化或半结构化的形式描述出来,供用户浏览、查询或者进一步分析利用。事件抽取具有更实用的价值和落地的可能。现有的事件抽取方法,包括基于管道方法以及基于端到端的深度学习的方法,其中以基于端到端的深度学习方法最为普遍。在基于深度学习的事件抽取中,Bi-LSTM+CRF的方法较为直观,并且已经取得了一定的精度,该方法使用双向循环神经网络进行上下文特征提取,CRF模型约束序列标签的预测。然而,该类方法仍然存在着一些不足:在特征嵌入层,使用预训练的词向量本文档来自技高网...

【技术保护点】
1.一种基于多层级图网络的事件联合抽取方法,其特征在于,包括:/n基于预训练语言模型,对输入的至少一个句子进行编码;/n基于编码后所述句子的依存句法树构建句子级的图网络,其中,所述句子级的图网络中的每一节点表示一个词,所述节点为第一节点;/n针对于每一个词,基于所述句子级的图网络,将当前词对应的节点周围的邻居节点代表的词的特征信息融入当前词的特征信息中,得到当前词新的特征信息;/n以所述句子为第二节点,根据不同句子之间的共现特征运算获取上下文句子的全局信息;/n将所述上下文句子的全局信息与所述当前词新的特征信息进行融合;/n基于融合了所述上下文句子的全局信息与所述当前词新的特征信息的所述词,识...

【技术特征摘要】
1.一种基于多层级图网络的事件联合抽取方法,其特征在于,包括:
基于预训练语言模型,对输入的至少一个句子进行编码;
基于编码后所述句子的依存句法树构建句子级的图网络,其中,所述句子级的图网络中的每一节点表示一个词,所述节点为第一节点;
针对于每一个词,基于所述句子级的图网络,将当前词对应的节点周围的邻居节点代表的词的特征信息融入当前词的特征信息中,得到当前词新的特征信息;
以所述句子为第二节点,根据不同句子之间的共现特征运算获取上下文句子的全局信息;
将所述上下文句子的全局信息与所述当前词新的特征信息进行融合;
基于融合了所述上下文句子的全局信息与所述当前词新的特征信息的所述词,识别事件触发词,根据所述触发词识别事件要素,对所述事件触发词和所述事件要素进行联合抽取。


2.根据权利要求1所述的基于多层级图网络的事件联合抽取方法,其特征在于,所述对输入的至少一个句子进行编码,包括:
构建BERT预训练语言模型;
将所述至少一个句子输入所述BERT预训练语言模型进行双向编码。


3.根据权利要求1所述的基于多层级图网络的事件联合抽取方法,其特征在于,采用基于自然语言处理工具Stanfordnlp构建的所述依存句法树;
采用邻接矩阵来计算所述第一节点的特征信息。


4.根据权利要求1所述的基于多层级图网络的事件联合抽取方法,其特征在于,所述识别事件触发词,包括:
使用至少两个全连接层及条件随机场作为分类器,对所述句子进行序列标注。


5.根据权利要求4所述的基于多层级图网络的事件联合抽取方法,其特征在于,所述句子包括实体,所述根据所述触发词识别事件要素,包括:
将所述实体的特征与所述触发词的特征进行首尾拼接,通过所述全连接层进行角色分类,进而识别所述事件要素。

【专利技术属性】
技术研发人员:孙显张泽群李树超李晓宇金力吕建伟李磊
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1