【技术实现步骤摘要】
一种基于动态前缀提示信息的事件抽取方法
[0001]本专利技术涉及一种基于动态前缀提示信息的事件抽取方法,属于计算机自然语言处理
技术介绍
[0002]事件抽取,是指从非结构化文本中根据预定义的事件本体抽取事件实例的过程,是一项可以增强下游应用的技术,同时也是让计算机理解和处理自然语言文本的一种重要的技术手段。
[0003]在事件抽取任务中,事件实例由事件触发词和事件元素组成。其中,事件触发词是一个动作性质的词语或短语,指示了事件的发生,具有特定的事件类别。事件元素是参与事件的实体,具有特定的角色。
[0004]在进行事件抽取之前,通常会定义事件本体,包括事件类型和各类型关注的角色。例如,在句子“The man returned to Los Angeles from Mexico following his capture Tuesday by bounty hunters.”中存在两个事件实例,一个由“returned”触发的运输(Transport)类型事件,和一个由“capture”触发的逮捕入狱(Arrest
‑
Jail)类型事件。
[0005]近年来,随着序列到序列预训练语言模型的广泛应用,利用文本生成解决信息抽取任务的方法受到大量关注。区别于传统的将事件触发词和事件元素抽取划分为识别和分类的方法,此类方法是基于生成的事件抽取方法。
[0006]目前,基于生成的事件抽取方法面临诸多挑战。
[0007]首先,现有方法受到人工构造离散提示文本 ...
【技术保护点】
【技术特征摘要】
1.一种基于动态前缀提示信息的事件抽取方法,其特征在于:首先,训练一个事件抽取器,包括一个相关性分类器、一个提示信息构造器和一个条件文本生成器;其中,相关性分类器是一个参数会随着训练而微调的BERT文本分类器;提示信息构造器是一个BERT文本编码器和由若干个前缀向量序列组成的集合;每个前缀向量序列对应一种事件抽取器所支持的事件类型,其中包含多个实值向量,且各序列中包含的向量个数相同;条件文本生成器是一个参数会随着训练而微调的预训练序列到序列语言模型BART;步骤1:建立带有事件实例标注的“事件实例集合
‑
文本对”训练样本和事件本体O;按照事件实例集合中的事件类型训练相关性分类器,并依次枚举事件类型;按照各事件类型的标注结果构造目标文本,由此训练出事件抽取器;步骤2:对待计算的输入文本,首先利用相关性分类器对输入文本进行预测,判断其中是否包含事件;若不包含事件,则输出空事件实例集合;若包含事件,则依次枚举事件类型,对每种事件类型均利用提示信息构造器动态构造前缀向量序列,利用条件文本生成器输出生成的文本,并按照规则解析得到事件实例的集合。2.如权利要求1所述的一种基于动态前缀提示信息的事件抽取方法,其特征在于,步骤1包括以下步骤:步骤1.1:人工对语料库中的文本进行标注,形成“事件实例集合
‑
文本对”训练样本和描述事件类型和结构的本体O;步骤1.2:对“事件实例集合
‑
文本对”训练样本中文本的事件实例集合进行是否为空的判断,如为空则相关性为“0”,如不为空则相关性为“1”,之后形成“相关性
‑
文本对”训练样本;步骤1.3:将“相关性
‑
文本对”训练样本中的每一条文本输入相关性分类器,进行目标为“0”和“1”的二分类,计算交叉熵损失函数;利用Adam优化算法进行训练,优化相关性分类器中的参数;步骤1.4:为每种事件类型e∈O,初始化一个独立的前缀向量序列作为参数,并设计一个生成模板t
e
;步骤1.5:选择“事件实例集合
‑
文本对”中相关性为“1”的训练样本,形成训练样本子集,并对训练样本子集中的“事件实例集合
‑
文本对”<S,c>,S表示事件实例集合,c表示输入文本;枚举事件类型,设当前处理的事件类型为e,进行后续步骤;步骤1.6:利用BERT文本编码器计算输入文本c的表示向量;步骤1.7:利用表示向量聚合代表各事件类型的前缀向量序列,形成一组动态构造的前缀向量序列P
c
;步骤1.8:根据事件实例集合S中事件类型为e的事件实例子集,构造目标文本g
e
;步骤1.9:将动态构造的前缀向量序列P
c
、生成模板t
e
、文本c输入条件文本生成器,计算输出目标文本g
e
的负对数似然作为损失函数;然后,利用AdamW优化算法进行训练,优化提示信息构造器和条件文本生成器中的参数;
优化结束后,得到包含最优参数的事件抽取器;步骤2包括以下步骤:步骤2.1:将待计算的输入文本c利用相关性分类器进行分类;若结果为“0”,即不相关,则直接输出空事件实例集合,结束步骤;若结果为“1”,即相关,则进入步骤2.2;步骤2.2:利用提示信息构造器的出一组动态构造的前缀向量序列P
c
;步骤2.3:枚举事件类型,设当前处理的事件类型为e;步骤2.4:将动态构造的前缀向量序列P
c
、生成模板t
e
、文本c输入条件文本生成器,得到输出文本o;步骤2.5:根据步骤1.8的构造规则对输出文本o进行解析,得到事件实例集合;步骤2.6:将枚举过程中所有事件类型的事件实例集合合并,得到最终的事件实例集合。3.如权利要求2所述的一种基于动态前缀提示信息的事件抽取方法,其特征在于,步骤1.3包括以下步骤:步骤1.3.1:使用BERT tokenizer,将输入文本c切分为subword序列,并在序列首、尾分别加上特殊符号“[CLS]”和“[SEP]”;步骤1.3.2:将添加首尾标记的subword序列输入BERT编码器,得到模型最后一层中特殊符号“[CLS]”对应的输出向量v
r
;步骤1.3...
【专利技术属性】
技术研发人员:黄河燕,刘啸,
申请(专利权)人:北京理工大学东南信息技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。