System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 事件抽取方法、装置、非易失性存储介质及电子设备制造方法及图纸_技高网

事件抽取方法、装置、非易失性存储介质及电子设备制造方法及图纸

技术编号:41287253 阅读:6 留言:0更新日期:2024-05-11 09:35
本申请公开了一种事件抽取方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定待抽取文本对应的初始句子序列,对初始句子序列进行预编码得到待抽取文本对应的初始句子表示;依据初始句子序列确定初始句子序列的带权邻接矩阵;采用预设事件处理模型处理初始句子表示和带权邻接矩阵得到待抽取文本对应的触发词序列和事件要素列表,预设事件处理模型中包括输入交互层,输入交互层用于将事件检测模型输出的触发词序列输入至事件要素检测模型,以及将事件要素检测模型输出的事件要素列表输入至事件检测模型。本申请解决了由于相关技术中不能利用不同事件抽取子任务之间的依赖关系导致的相关技术中的事件抽取结果准确率较低的技术问题。

【技术实现步骤摘要】

本申请涉及电数字数据处理领域,具体而言,涉及一种事件抽取方法、装置、非易失性存储介质及电子设备


技术介绍

1、相关技术中在从文本中抽取事件信息时,不能充分利用不同的事件抽取子任务之间的依赖关系,导致相关技术中的事件抽取结果准确率较低。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种事件抽取方法、装置、非易失性存储介质及电子设备,以至少解决由于相关技术中不能利用不同事件抽取子任务之间的依赖关系导致的相关技术中的事件抽取结果准确率较低的技术问题。

2、根据本申请实施例的一个方面,提供了一种事件抽取方法,包括:确定待抽取文本对应的初始句子序列,并对初始句子序列进行预编码得到待抽取文本对应的初始句子表示;依据初始句子序列确定初始句子序列对应的带权邻接矩阵;采用预设事件处理模型处理初始句子表示和带权邻接矩阵,得到待抽取文本对应的触发词序列和事件要素列表,其中,预设事件处理模型中包括事件检测模型,事件要素检测模型和输入交互层,事件检测模型和事件要素检测模型之间通过输入交互层连接,输入交互层用于将事件检测模型输出的触发词序列输入至事件要素检测模型,以及将事件要素检测模型输出的事件要素列表输入至事件检测模型。

3、可选地,依据初始句子序列确定初始句子序列对应的依存关系图和带权邻接矩阵的步骤包括:对初始句子序列进行依存句法分析,得到依存句法分析结果;依据依存句法分析结果构造依存关系图,以及依存关系图对应的带权邻接矩阵。

4、可选地,采用预设事件处理模型处理初始句子表示和带权邻接矩阵,得到待抽取文本对应的触发词序列的步骤包括:通过事件检测模型融合初始句子表示和待抽取文本对应的实体特征序列,以及目标事件要素向量序列,得到第一目标词向量序列,其中,目标事件要素特征序列为随机事件要素向量序列,或者输入交互层依据事件要素检测模型输出的事件要素列表生成的事件要素向量序列;对第一目标词向量序列进行编码,得到第一节点序列,并通过事件检测模型中的注意力机制确定目标节点序列中的各个节点对应的注意力分数;依据各个节点对应的注意力分数对带权邻接矩阵中与节点对应的特征向量进行加权处理,得到目标邻接矩阵;对目标邻接矩阵和第一节点序列进行编码,得到第二节点序列;对第二节点序列进行事件检测,得到触发词序列。

5、可选地,采用预设事件处理模型处理初始句子表示和带权邻接矩阵,得到待抽取文本对应的事件要素列表的步骤包括:确定初始句子序列对应的初始词向量和实体信息;通过事件要素检测模型融合初始词向量,实体信息和目标事件类型标签向量序列,得到第二目标词向量序列,其中,目标事件类型标签向量序列为随机事件类型标签向量序列或者输入交互层依据事件检测模型输出的触发次序列生成的事件类型标签向量序列;对第二目标词序列进行编码,得到第二节点序列,并确定第二节点序列中的各个实体节点对应的目标依存关系子图和目标带权邻接矩阵;利用注意力机制计算各个实体节点针对不同依赖标签的注意力分数,并依据注意力分数更新目标带权邻接矩阵;依据各个实体节点对应的更新后的目标带权邻接矩阵确定各个实体节点对应的依赖标签特征;依据各个实体节点的相邻节点和依赖标签特征确定各个实体节点对应的事件要素,从而得到事件要素列表。

6、可选地,输入交互层用于将触发词序列进行格式化后作为第一外部特征输入到事件要素检测模型中,以及将事件要素列表进行格式化后作为第二外部特征输入到事件检测模型中。

7、可选地,将触发词序列进行格式化后作为第一外部特征输入到事件要素检测模型中的步骤包括:对触发词序列进行编码,并依据编码结果和向量表确定触发词序列对应的事件类型标签向量序列;将事件类型标签向量序列作为第一外部特征输入到事件要素检测模型中。

8、可选地,将事件要素列表进行格式化后作为第二外部特征输入到事件检测模型中的步骤包括:对事件要素列表进行编码,并依据编码结果和向量表确定事件要素列表对应的事件要素向量序列;将事件要素向量序列作为第二外部特征输入到事件检测模型中。

9、根据本申请实施例的另一方面,还提供了一种事件抽取装置,包括:第一处理模块,用于确定待抽取文本对应的初始句子序列,并对初始句子序列进行预编码得到待抽取文本对应的初始句子表示;第二处理模块,用于依据初始句子序列确定初始句子序列对应的带权邻接矩阵;第三处理模块,用于采用预设事件处理模型处理初始句子表示和带权邻接矩阵,得到待抽取文本对应的触发词序列和事件要素列表,其中,预设事件处理模型中包括事件检测模型,事件要素检测模型和输入交互层,事件检测模型和事件要素检测模型之间通过输入交互层连接,输入交互层用于将事件检测模型输出的触发词序列输入至事件要素检测模型,以及将事件要素检测模型输出的事件要素列表输入至事件检测模型。

10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行事件抽取方法。

11、根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行事件抽取方法。

12、在本申请实施例中,采用确定待抽取文本对应的初始句子序列,并对初始句子序列进行预编码得到待抽取文本对应的初始句子表示;依据初始句子序列确定初始句子序列对应的带权邻接矩阵;采用预设事件处理模型处理初始句子表示和带权邻接矩阵,得到待抽取文本对应的触发词序列和事件要素列表,其中,预设事件处理模型中包括事件检测模型,事件要素检测模型和输入交互层,事件检测模型和事件要素检测模型之间通过输入交互层连接,输入交互层用于将事件检测模型输出的触发词序列输入至事件要素检测模型,以及将事件要素检测模型输出的事件要素列表输入至事件检测模型的方式,通过输入交互层将事件检测模型和事件要素检测模型关联,达到了充分利用不同的事件抽取子任务之间的关联性的目的,从而实现了提高事件抽取结果的准确率的技术效果,进而解决了由于相关技术中不能利用不同事件抽取子任务之间的依赖关系导致的相关技术中的事件抽取结果准确率较低技术问题。

本文档来自技高网...

【技术保护点】

1.一种事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的事件抽取方法,其特征在于,所述依据所述初始句子序列确定所述初始句子序列对应的依存关系图和带权邻接矩阵的步骤包括:

3.根据权利要求1所述的事件抽取方法,其特征在于,所述采用预设事件处理模型处理所述初始句子表示和所述带权邻接矩阵,得到所述待抽取文本对应的触发词序列的步骤包括:

4.根据权利要求1所述的事件抽取方法,其特征在于,所述采用预设事件处理模型处理所述初始句子表示和所述带权邻接矩阵,得到所述待抽取文本对应的事件要素列表的步骤包括:

5.根据权利要求1所述的事件抽取方法,其特征在于,所述输入交互层用于将所述触发词序列进行格式化后作为第一外部特征输入到所述事件要素检测模型中,以及将所述事件要素列表进行格式化后作为第二外部特征输入到所述事件检测模型中。

6.根据权利要求5所述的事件抽取方法,其特征在于,所述将所述触发词序列进行格式化后作为第一外部特征输入到所述事件要素检测模型中的步骤包括:

7.根据权利要求5所述的事件抽取方法,其特征在于,所述将所述事件要素列表进行格式化后作为第二外部特征输入到所述事件检测模型中的步骤包括:

8.一种事件抽取装置,其特征在于,包括:

9.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述的事件抽取方法。

10.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器用于运行存储在所述存储器中的程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的事件抽取方法。

...

【技术特征摘要】

1.一种事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的事件抽取方法,其特征在于,所述依据所述初始句子序列确定所述初始句子序列对应的依存关系图和带权邻接矩阵的步骤包括:

3.根据权利要求1所述的事件抽取方法,其特征在于,所述采用预设事件处理模型处理所述初始句子表示和所述带权邻接矩阵,得到所述待抽取文本对应的触发词序列的步骤包括:

4.根据权利要求1所述的事件抽取方法,其特征在于,所述采用预设事件处理模型处理所述初始句子表示和所述带权邻接矩阵,得到所述待抽取文本对应的事件要素列表的步骤包括:

5.根据权利要求1所述的事件抽取方法,其特征在于,所述输入交互层用于将所述触发词序列进行格式化后作为第一外部特征输入到所述事件要素检测模型中,以及将所述事件要素列表进行格式化后作为第二外部特征输...

【专利技术属性】
技术研发人员:王晨陆谦黄勤李想高丽华
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1