一种事件抽取方法及装置制造方法及图纸

技术编号:38008455 阅读:7 留言:0更新日期:2023-06-30 10:26
本发明专利技术公开了一种事件抽取方法及装置,包括:获取事件类型集合、角色类型集合以及待抽取事件的目标句子;将所述事件类型集合中的各个事件类型,以及所述角色类型集合中的各个论元角色,确定为实体集合;基于所述实体集合,对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体;基于所述目标实体,生成所述目标句子对应的论元关系图;利用预设的搜索算法,搜索所述论元关系图中的完全子图;基于所述完全子图,生成所述目标句子对应的事件信息。本发明专利技术能够改善事件抽取效果。本发明专利技术能够改善事件抽取效果。本发明专利技术能够改善事件抽取效果。

【技术实现步骤摘要】
一种事件抽取方法及装置


[0001]本专利技术涉及自然语言处理
,具体而言,涉及一种事件抽取方法及装置。

技术介绍

[0002]目前,事件抽取任务的目标是通过给定目标事件类型和角色类型集合及句子,识别句子中所有目标事件类型的事件,并根据论元角色集合抽取事件所对应的论元。
[0003]在实践中发现,现在的事件抽取方式通常需要依次执行触发词检测、事件/触发词类型识别、事件论元检测和论元角色识别这四个子任务。然而,这种事件抽取方式需要先检测触发词,再基于触发词做进一步的处理。如果在触发词检测环节出现问题,则难以进行下一步的处理。可见,现在的事件抽取方法存在着事件抽取效果不佳的问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种事件抽取方法及装置,以至少改善事件抽取效果。
[0006]根据本专利技术实施例的一个方面,提供了一种事件抽取方法,所述方法包括:获取事件类型集合、角色类型集合以及待抽取事件的目标句子;将所述事件类型集合中的各个事件类型,以及所述角色类型集合中的各个论元角色,确定为实体集合;基于所述实体集合,对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体;基于所述目标实体,生成所述目标句子对应的论元关系图;利用预设的搜索算法,搜索所述论元关系图中的完全子图;基于所述完全子图,生成所述目标句子对应的事件信息。
[0007]作为一种可选的实施方式,基于所述实体集合,对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体,包括:对所述目标句子进行编码,得到目标向量序列;将所述目标向量序列转换为第一向量序列和第二向量序列;利用所述第一向量序列和所述第二向量序列,对所述实体集合中的每个实体进行打分,得到实体评分信息;基于所述实体评分信息,确定与所述目标句子对应的所述目标实体。
[0008]作为一种可选的实施方式,基于所述目标实体,生成所述目标句子对应的论元关系图,包括:将各个所述目标实体,确定为所述目标句子对应的各个论元;构建各个所述论元之间的所述论元关系图。
[0009]作为一种可选的实施方式,利用预设的搜索算法,搜索所述论元关系图中的完全子图,包括:确定所述论元关系图中的所有节点对;如果所有节点对均相邻,则将所述论元关系图确定为所述完全子图。
[0010]作为一种可选的实施方式,所述方法还包括:如果存在节点对不相邻,则对不相邻的节点对执行候选子图构建操作,得到每个节点对应的候选子图;如果所述候选子图中的所有节点对相邻,则将所述候选子图确定为所述完全子图;如果所述候选子图中存在节点对不相邻,则对不相邻的节点对重复执行所述候选子图构建操作,以得到更新后的候选子图,直至所述更新后的候选子图中的所有节点对相邻。
[0011]作为一种可选的实施方式,所述候选子图构建操作为:对不相邻的节点对中的每个节点,确定该节点的相邻节点集合;基于该节点、以及与该节点的相邻节点集合,确定所述候选子图。
[0012]根据本专利技术实施例的另一方面,还提供了一种事件抽取装置,包括:数据获取单元,用于获取事件类型集合、角色类型集合以及待抽取事件的目标句子;实体构建单元,用于将所述事件类型集合中的各个事件类型,以及所述角色类型集合中的各个论元角色,确定为实体集合;实体识别单元,用于基于所述实体集合,对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体;论元关系生成单元,用于基于所述目标实体,生成所述目标句子对应的论元关系图;子图搜索单元,用于利用预设的搜索算法,搜索所述论元关系图中的完全子图;事件生成单元,用于基于所述完全子图,生成所述目标句子对应的事件信息。
[0013]作为一种可选的实施方式,所述实体识别单元具体用于:对所述目标句子进行编码,得到目标向量序列;将所述目标向量序列转换为第一向量序列和第二向量序列;利用所述第一向量序列和所述第二向量序列,对所述实体集合中的每个实体进行打分,得到实体评分信息;基于所述实体评分信息,确定与所述目标句子对应的所述目标实体。
[0014]作为一种可选的实施方式,所述论元关系生成单元具体用于:将各个所述目标实体,确定为所述目标句子对应的各个论元;构建各个所述论元之间的所述论元关系图。
[0015]作为一种可选的实施方式,所述子图搜索单元具体用于:确定所述论元关系图中的所有节点对;如果所有节点对均相邻,则将所述论元关系图确定为所述完全子图。
[0016]作为一种可选的实施方式,所述子图搜索单元具体用于:如果存在节点对不相邻,则对不相邻的节点对执行候选子图构建操作,得到每个节点对应的候选子图;如果所述候选子图中的所有节点对相邻,则将所述候选子图确定为所述完全子图;如果所述候选子图中存在节点对不相邻,则对不相邻的节点对重复执行所述候选子图构建操作,以得到更新后的候选子图,直至所述更新后的候选子图中的所有节点对相邻。
[0017]作为一种可选的实施方式,所述候选子图构建操作为:对不相邻的节点对中的每个节点,确定该节点的相邻节点集合;基于该节点、以及与该节点的相邻节点集合,确定所述候选子图。
[0018]根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述事件抽取方法。
[0019]根据本专利技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的事件抽取方法。
[0020]在本专利技术实施例中,通过将各个事件类型和各个角色类型组合成一个大类,构成实体集合,从而将事件抽取问题转换为命名实体识别问题,并特别地对存在嵌套问题的实体,采用嵌套实体识别的方式,确定目标句子中的目标实体(即组成目标句子的各个事件的论元),之后,生成论元关系图,对论元关系图搜索完全子图,确定得到目标句子对应的事件信息,可以理解,一个完全子图对应着一个事件。采用本专利技术实施例中的方案,无需考虑触发词,直接将事件类型和论元角色都划分为实体,再进行嵌套实体识别,结合完全子图搜索,能够改善事件抽取效果。
附图说明
[0021]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的事件抽取方法的流程图;图2是根据本专利技术实施例的另一种可选的事件抽取方法的流程图;图3是根据本专利技术实施例的一种可选的事件抽取示意图;图4是根据本专利技术实施例的一种可选的完全子图示意图;图5是根据本专利技术实施例的一种可选的事件抽取装置的结构示意图;图6是根据本专利技术实施例的一种可选的电子装置的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法,其特征在于,包括:获取事件类型集合、角色类型集合以及待抽取事件的目标句子;将所述事件类型集合中的各个事件类型,以及所述角色类型集合中的各个论元角色,确定为实体集合;其中,所述实体集合包含触发词;基于所述实体集合,采用GlobalPointer对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体;其中,所述目标实体为所述目标句子对应的事件中的论元;基于所述目标实体,生成所述目标句子对应的论元关系图;利用预设的搜索算法,搜索所述论元关系图中的完全子图;其中,所述完全子图指的是对同一事件的任意两个节点都是相邻的,一个所述完全子图对应一个事件;基于所述完全子图,生成所述目标句子对应的事件信息;其中,所述事件信息为每个完全子图构成的事件对应的论元信息。2.根据权利要求1所述的方法,其特征在于,基于所述实体集合,采用GlobalPointer对所述目标句子进行嵌套实体识别,得到所述目标句子对应的目标实体,包括:对所述目标句子进行编码,得到目标向量序列;将所述目标向量序列转换为第一向量序列和第二向量序列;利用所述第一向量序列和所述第二向量序列,对所述实体集合中的每个实体进行打分,得到实体评分信息;基于所述实体评分信息,确定与所述目标句子对应的所述目标实体。3.根据权利要求1所述的方法,其特征在于,基于所述目标实体,生成所述目标句子对应的论元关系图,包括:将各个所述目标实体,确定为所述目标句子对应的各个论元;构建各个所述论元之间的所述论元关系图。4.根据权利要求1所述的方法,其特征在于,利用预设的搜索算法,搜索所述论元关系图中的完全子图,包括:确定所述论元关系图中的所有节点对;如果所有节点对均相邻,则将所述论元关系图确定为所述完全子图。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:如果存在节点对不相邻,则对不相邻的节点对执行候选子图构建操作,得到每个节点对应的候选子图;如果所述候选子图中的所有节点对相邻,则将所述候选子图确定为所述完全子图;如果所述候选子图中存在节点对不相邻,则对不相邻的节...

【专利技术属性】
技术研发人员:汤伟郭行飞刘永丹
申请(专利权)人:中新宽维传媒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1