事件抽取方法、装置、计算机程序产品、存储介质及设备制造方法及图纸

技术编号:34916272 阅读:50 留言:0更新日期:2022-09-15 07:06
本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。相对位置关系。相对位置关系。

【技术实现步骤摘要】
事件抽取方法、装置、计算机程序产品、存储介质及设备


[0001]本申请涉及计算机
,尤其涉及一种事件抽取方法、装置、计算机程序产品、存储介质及设备。

技术介绍

[0002]随着互联网的高速发展,越来越多的信息以电子文本的形式呈现给用户。为了帮助用户在海量信息中快速找到所需要的信息,提出了信息抽取的概念。信息抽取是指从自然语言文本中抽取事实信息,并且以结构化的形式描述信息。事件抽取是信息抽取中的一个重要研究方向,主要是指从含有事件信息的文本数据中抽取出感兴趣的事件信息,并且将用自然语言表达事件以结构化的形式呈现,比如,什么人、什么地方、什么时间、做了什么事。
[0003]可见,事件抽取在现今的海量信息时代具有极为广阔的应用前景。

技术实现思路

[0004]本申请实施例提供的一种事件抽取方法、装置、计算机程序产品、存储介质及设备,实现了对目标文本的事件抽取。所述技术方案如下:
[0005]第一方面,本申请实施例提供了一种事件抽取方法,所述方法包括:
[0006]识别目标文本中的至少一个触发词,获取所述至本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法,所述方法包括:识别目标文本中的至少一个触发词,获取所述至少一个触发词中各触发词对应的触发词向量;基于所述各触发词对应的触发词向量、所述各触发词对应的事件类型向量以及所述各触发词对应的相对位置向量,在所述目标文本中确定与各触发词对应的事件类型相关联的要素词信息,所述要素词信息包括至少一个要素词中各要素词对应的位置信息和所述各要素词之间的要素关系;基于所述各要素词的位置信息以及所述各要素词之间的要素关系,生成所述目标文本对应的事件抽取结果;其中,所述各触发词对应的事件类型向量用于表示所述目标触发词对应的事件类型,所述各触发词对应的相对位置向量用于表示所述目标文本中各单词和各触发词之间的相对位置关系。2.根据权利要求1所述的事件抽取方法,所述识别目标文本中的至少一个触发词,获取所述至少一个触发词中各触发词对应的触发词向量,包括:将目标文本中的各单词进行向量化处理,得到至少一个原始词向量;基于预设的二分类器对所述至少一个原始词向量中的各原始词向量分别进行二分类处理,以确定所述至少一个触发词中各触发词对应的触发词向量。3.根据权利要求2所述的事件抽取方法,所述基于预设的至少一个二分类器对所述至少一个原始词向量中各原始词向量分别进行二分类处理,以确定所述至少一个触发词中各触发词对应的触发词向量,包括:按照所述至少一个原始词向量中各原始词向量在目标文本中的初始顺序,对所述各原始词向量依次进行二分类处理,以确定至少一个起始词向量;按照原始词向量的在目标文本中的初始顺序分别从各起始词向量位置开始依次识别预设数量的原始词向量,确定与各起始词向量分别对应的结束词向量;分别将各起始词向量与对应的结束词向量之间所包含的所有原始词向量组合生成触发词向量,以得到所述至少一个触发词中各触发词对应的触发词向量。4.根据权利要求2所述的事件抽取方法,所述基于预设的至少一个二分类器对所述至少一个原始词向量中各原始词向量分别进行二分类处理,以确定所述至少一个触发词中各触发词对应的触发词向量,包括:基于预设的至少一个二分类器对所述至少一个原始词向量中各原始词向量分别进行二分类处理,以确定至少一个初始触发词向量;在所述至少一个初始触发词向量中筛选出与所述目标文本对应的至少一个触发词中各触发词对应的触发词向量。5.根据权利要求2所述的事件抽取方法,所述基于所述各触发词对应的触发词向量、所述各触发词对应的事件类型向量以及所述各触发词对应的相对位置向量,在所述目标文本中确定与各触发词对应的事件类型相关联的要素词信息,包括:将所述至少一个原始词向量分别融合目标触发词向量,得到至少一个融合词向量,所述目标触发词向量为所述至少一个触发词中的任意一个触发词对应的触发词向量;基于所述二分类器确定所述目标触发词向量对应的事件类型向量;
基于所述目标触发词向量对应的目标起始词向量的位置信息以及目标结束词向量的位置信息,生成所述目标触发词向量对应的相对位置向量;将所述至少一个融合词向量、所述事件类型向量、所述相对位置向量通过多层感知机融合生成第一要素矩阵;基于所述第一要素矩阵确定与所述目标触发词对应事件类型相关联的要素...

【专利技术属性】
技术研发人员:徐军王太峰孙梦姝
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1