突发事件抽取方法、系统、介质、电子设备技术方案

技术编号:37321586 阅读:26 留言:0更新日期:2023-04-21 23:01
本发明专利技术提供一种突发事件抽取方法、系统、介质、电子设备,所述方法包括以下步骤:获取包含突发事件的待抽取文本;提取所述待抽取文本中的触发词和事件类别;当同时提取到所述触发词和所述事件类别时,基于所述触发词提取所述待抽取文本的第一论元,基于所述事件类别提取所述待抽取文本的第二论元;对所述第一论元和所述第二论元进行融合。本发明专利技术的突发事件抽取方法、系统、介质、电子设备基于管道式抽取方式,在步骤中融入触发词信息,从而有效提高了突发事件任务抽取的有效性。突发事件任务抽取的有效性。突发事件任务抽取的有效性。

【技术实现步骤摘要】
突发事件抽取方法、系统、介质、电子设备


[0001]本专利技术涉及事件抽取的
,特别是涉及一种突发事件抽取方法、系统、介质、电子设备。

技术介绍

[0002]事件抽取指的是从自然语言文本中抽取出用户感兴趣的事件信息,并且以结构化的形式呈现出来。较为权威的数据集ACE2005将该项任务定义为:识别特定类型的事件,并进行相关信息的确定和抽取,主要相关信息包括:事件的类型和子类型、事件元素角色等。
[0003]现有技术中事件抽取方式主要包括以下几种。
[0004](1)模式匹配,根据语言的模式、设计模板,将待抽取的句子和已有的模板进行匹配。常见的方法有,基于语法树或者正则表达式。
[0005](2)基于机器学习的方法,其中将事件抽取问题转化为分类问题,采用常见的分类算法如svm实现,需要人工设计语言特征。该方法主要有以下两种实现方式。
[0006]a)基于管道式/流水线式(pipeline),将任务转化为多阶段分类任务。完整的事件抽取有如下步骤:步骤1、事件触发词分类,即判断一个词是否出发了事件,并对事件进行分类本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种突发事件抽取方法,其特征在于:所述方法包括以下步骤:获取包含突发事件的待抽取文本;提取所述待抽取文本中的触发词和事件类别;当同时提取到所述触发词和所述事件类别时,基于所述触发词提取所述待抽取文本的第一论元,基于所述事件类别提取所述待抽取文本的第二论元;对所述第一论元和所述第二论元进行融合。2.根据权利要求1所述的突发事件抽取方法,其特征在于:提取所述待抽取文本中的触发词和事件类别包括以下步骤:训练用于提取触发词和事件类别的触发词识别和事件类别识别联合模型,所述触发词识别和事件类别识别联合模型的损失为触发词提取损失和所述事件类别提取损失之和;将所述待抽取文本输入训练好的触发词识别和事件类别识别联合模型,以获取所述触发词和所述事件类别。3.根据权利要求1所述的突发事件抽取方法,其特征在于:基于所述触发词提取所述待抽取文本的第一论元包括以下步骤:构建基于触发词的论元提取模型,所述基于触发词的论元提取模型包括依次连接的BERT模型、所述触发词的位置信息层、基于所述触发词的条件Layer Normalization层和抽取层;将所述待抽取文本输入所述基于触发词的论元提取模型,以获取所述第一论元。4.根据权利要求3所述的突发事件抽取方法,其特征在于:所述触发词的位置信息层中,根据距离触发词的距离设定一位置向量,并将所述位置向量映射到一个维度与所述BERT模型的输出级联。5.根据权利要求3所述的突发事件抽取方法,其特征在于:所述基于所述触发词的条件Layer Normalization层中,对所述触发词的向量进行线性映射后代替Layer Normalization层中的gamma和beta。6.根据权利要求1所述的突发事件抽取方法,其特征在...

【专利技术属性】
技术研发人员:吴方舟王本强
申请(专利权)人:上海蜜度信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1