一种基于层叠式指针网络的供需事件抽取方法及系统技术方案

技术编号:37249124 阅读:27 留言:0更新日期:2023-04-20 23:28
本发明专利技术公开了一种基于层叠式指针网络的供需事件抽取方法及系统,包括:将供需事件抽取定义为一个基于字符的触发词抽取和元素抽取两阶段抽取任务,并通过对词嵌入层添加扰动因子进行对抗训练,构建基于层叠式指针网络的供需事件抽取模型;通过供需事件抽取模型,从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来;本发明专利技术提出的层叠式指针网络管道模型利用触发词文字信息、触发词位置信息、触发词标记信息建立两个子任务之间的有效特征连接,并通过堆叠多层指针网络、级联解码解决了供需事件抽取中普遍存在的元素跨度较长、多事件共现、元素重叠嵌套等问题。题。题。

【技术实现步骤摘要】
一种基于层叠式指针网络的供需事件抽取方法及系统


[0001]本专利技术涉及事件抽取任务
,具体而言,涉及一种基于层叠式指针网络的供需事件抽取方法及系统。

技术介绍

[0002]事件抽取任务研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息并以结构化的形式表示,是构建事件图谱的基础工作。ACE评测会议将事件抽取任务划分为事件检测(触发词抽取)和事件元素抽取两个任务。其中,触发词抽取任务通过识别句子中指示事件发生的核心词来检测事件,并判断事件类型。例如,ACE05中将“出生”、“生子”等作为“出生事件”的触发词。
[0003]供需事件抽取属于事件抽取的研究范畴,旨在从海量的新闻文本、行业资讯中自动获取供需关系信息,进而为产业链供应链的梳理、分析和优化提供可计算的信息资源。供需事件抽取任务涉及两种事件类型,即供给事件和需求事件,其语义由事件元素以及触发词确定的元素间的供需关系来表达。供给事件触发词如“出售”、“提供”等,需求事件触发词如“购买”、“收购”等。如图1例句中,触发词“卖”指示了一个供给类型的事件。
[0004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于层叠式指针网络的供需事件抽取方法,其特征在于,包括以下步骤:将供需事件抽取定义为一个基于字符的触发词抽取和元素抽取两阶段抽取任务,并通过对词嵌入层添加扰动因子进行对抗训练,构建基于层叠式指针网络的供需事件抽取模型;通过所述供需事件抽取模型,从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。2.根据权利要求1所述一种基于层叠式指针网络的供需事件抽取方法,其特征在于:在构建供需事件抽取模型的过程中,采用多层双指针的标注方式实现触发词抽取、元素抽取标注任务,用于解决重叠嵌套问题;针对每个字使用双指针构成两个0/1序列确定实体的跨度,针对不同类型的事件或角色,堆叠多层0/1序列,每层识别不同类型的实体,其中,双指针表示两个二分类器,0/1表示当前字是否为实体的起始、终止位置。3.根据权利要求2所述一种基于层叠式指针网络的供需事件抽取方法,其特征在于:在针对不同类型的事件或角色的过程中,针对单事件时,通过标注当前句子中所有触发词,在其对应的事件类型层,将触发词的起始位置、终止位置标注为1,其他位置标记为0;元素抽取任务标注当前事件下所有元素,在其对应的元素角色层,将元素起始位置、终止位置标注为1,其他位置标记为0;针对多事件时,通过标注方式与单事件相同,元素抽取任务标注事件数量个样本,每个样本针对每个事件标注当前事件下的所有元素。4.根据权利要求3所述一种基于层叠式指针网络的供需事件抽取方法,其特征在于:在进行触发词抽取的过程中,通过触发词抽取模型进行触发词抽取,预测文本中每个字c
i
是否为事件类型l
t
的触发词起始或终止位置,其中,所述触发词抽取模型包括:编码器为BERT,用于将输入文本表示成向量;解码器为指针网络,用于将向量转化为0/1序列。5.根据权利要求4所述一种基于层叠式指针网络的供需事件抽取方法,其特征在于:在使用解码器将向量转化为0/1序列的过程中,将向量输入到所述解码器的全连接层Dense,经过Sigmoid激活函数,通过获取检测触发词的起始位置的二进制分类器的权重项和偏置项,以及检测所述触发词的终止位置的二进制分类器的权重项和偏置项,预测所述触发词的所述起始位置和所述终止位置的概率,将向量转化...

【专利技术属性】
技术研发人员:白宇宁培强
申请(专利权)人:沈阳航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1