一种基于多任务联合学习的事件检测方法技术

技术编号：38575970 阅读：12 留言：0更新日期：2023-08-26 23:23

本发明专利技术公开了一种基于多任务联合学习的事件检测方法，涉及到自然语言处理中信息抽取任务中的事件检测技术领域，包括以下步骤：S1：样本生成，S2：基于深度预训练模型的多任务联合学习。本发明专利技术把事件检测任务拆分为事件类型判断和触发词识别两个子任务，然后对两个子任务进行联合建模学习，模型的输入包含了事件类型和文本内容，通过注意力机制可以更好地学习标签与文本之间的关系，同时利用任务之间的相关性进一步提升模型的学习效果。关性进一步提升模型的学习效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多任务联合学习的事件检测方法

[0001]本专利技术涉及自然语言处理中信息抽取任务中的事件检测
，特别涉及一种基于多任务联合学习的事件检测方法。

技术介绍

[0002]事件抽取的目标是自动地从从非结构化文本中识别所出现的事件的触发词、事件类型、事件论元等，是自然语言处理的重要研究领域。事件检测作为事件抽取的子任务之一，旨在从给定文本中识别事件触发词并将其分类到正确的事件类型，触发词指的是标记事件出现的核心词语或短语，事件类型为任务中预定义好的需要检测的事件的类型。
[0003]目前主流的事件检测方法有以下几种方案：
[0004]一、基于词典或规则的方法
[0005]基于词典或规则的方法针对每种事件构造触发词词典或设计触发词检测模板，然后通过匹配来识别触发词和事件类型。
[0006]二、基于深度学习的方法
[0007]神经网络模型能够自动地从原始文本中学习与触发词相关的高层次特征表示，因此将原始文本作为输入，使用LSTM、Transformer等深度学习模型自动地学习文本特征，然后进行字符级别的分类实现触发词识别，并进一步实现事件类型判断。
[0008]三、多特征融合的方法
[0009]该方法通常会把句法依存特征、词性特征、词向量特征等多种特征进行融合，然后输入LSTM、Transformer、GCN(Graph Convolutional Network，图卷积神经网络)等网络进行学习，从而实现触发词识别和分类。句法依存关系可以表示词与词之间的依赖...

【技术保护点】

【技术特征摘要】
1.一种基于多任务联合学习的事件检测方法，其特征在于：包括以下步骤：S1：样本生成，如某业务场景预定义的事件类型为Label＝[“受伤”,“判刑”,“盗窃”]，对于文本“被告人袁某用拳头将被害人郭某面部打伤”,其中包含的触发词为“打伤”，事件类型为“受伤”，把事件类型与正文拼接，然后分别标注触发词和事件类型，触发词识别作为序列标注任务使用BIO标注模式，“B”表示触发词的开始，“I”表示触发词的中间或者结尾，“O”表示不属于触发词；事件类型判断为二分类任务，“1”表示文本中包含该事件类型，“0”表示文本中不包含该事件类型；S2：基于深度预训练模型的多任务联合学习，对触发词识别和事件类型判断联合建模，两个子任务共享神经网络隐层参数，然后针对不同任务构建各自的分类器完成各自任务目标，详细的模型计算步骤如下：a.把事件类型l
i
和文本内容text拼接，并在首尾分别添加“[CLS]”和“[SEP]”标志，然后进行切分，得到序列X＝[[CLS],x1,x2,x3,...,x
n
,[SEP]]；b.把序列X输入到BERT模型，得到表示向量E＝[e
[CLS]
,e1,e2,e3,...,e
n
,e
[SEP]
]；c1.触发词识别(1).把文本中每个字符的表示向量e
n
输入全连接神经网络，并经过softmax层后输出，得到该字符属于“BIO”中每种类型的概率P＝[p
B
,p
I
,p
O
]；(2)...

【专利技术属性】
技术研发人员：袁丁，程龙龙，崔丙剑，田野，曹琉，
申请(专利权)人：中电云脑天津科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人