事件时序关系识别方法、装置、设备及介质制造方法及图纸

技术编号:38861564 阅读:15 留言:0更新日期:2023-09-17 10:03
本公开提供了一种事件时序关系识别方法,包括:获取输入文本中的事件的全局语义信息,其中,输入文本至少包括两个事件,事件包括触发词和事件论元;对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组;将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;根据事件时序类型的先验概率,获取事件的先验知识的约束信息;将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及将融合信息输入事件时序关系分类模型,得到事件的时序关系。本公开还提供了一种事件时序关系识别装置、设备、存储介质和程序产品。程序产品。程序产品。

【技术实现步骤摘要】
事件时序关系识别方法、装置、设备及介质


[0001]本公开涉及深度学习和人工智能
,更具体地涉及一种事件时序关系识别方法、装置、设备、介质和程序产品。

技术介绍

[0002]事件序列关系的识别是关系抽取中的一个子任务。目的是及时确定两个目标事件发生的先后顺序,例如:在

前和在

后等。对事件时序关系的认识得到越来越多研究者的关注。这个任务有助于事件脉络的自动抽取和生成。因此,该技术可以有效应用在各个垂直领域解决特点场景问题。例如,在医疗领域,可以根据某些疾病在不同时期的状态和变化,更准确地选择治疗方案。总之,事件时序关系的识别可以促进许多其他自然语言处理任务,例如问答系统、文本摘要、文本含义和知识图谱构建。
[0003]传统的基于规则以及基于统计方法的事件时序抽取方法依赖于语言学专家依靠经验所编写的特定规则、人工精心设计的特征和复杂的自然语言处理工具。这些方法虽然经过实验证明是有效的,但是花费了大量人工精力、缺乏泛化能力,而且会有规则不完全、特征稀疏的问题。此外,传统的特征很难抓取词的语义信息以及句子的深层语义信息。

技术实现思路

[0004]鉴于上述问题,本公开提供了事件时序关系识别方法、装置、设备、介质和程序产品。
[0005]根据本公开的第一个方面,提供了一种事件时序关系识别方法,包括:
[0006]获取输入文本中的事件的全局语义信息,其中,输入文本至少包括两个事件,事件包括触发词和事件论元;
[0007]对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组,其中,句法依存三元组包括:第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系;路径依存三元组包括:第一目标事件词、第二目标事件词、第一目标事件词与第二目标事件词之间的路径依存关系;
[0008]将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;
[0009]根据事件时序类型的先验概率,获取事件的先验知识的约束信息;
[0010]将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及
[0011]将融合信息输入事件时序关系分类模型,得到事件的时序关系。
[0012]根据本公开的实施例,根据事件时序类型的先验概率,获取事件的先验知识的约束信息包括:
[0013]利用百科类数据集计算事件时序类型出现的频数,以作为事件时序类型的先验概率;
[0014]在先验概率满足阈值的情况下,确定事件时序类型的概率;
[0015]将事件时序类型的概率映射为向量,得到事件的先验知识的约束信息。
[0016]根据本公开的实施例,获取输入文本中的事件的全局语义信息包括:
[0017]获取输入文本的词列表和词性列表;
[0018]利用预训练语言模型,将词列表表示为词嵌入向量,以及词性列表表示为词性嵌入向量;
[0019]将词嵌入向量以及词性嵌入向量融合,得到融合嵌入向量;
[0020]将融合嵌入向量输入神经网络模型,根据神经网络模型的隐藏层的输出确定输入文本中的事件的全局语义信息。
[0021]根据本公开的实施例,神经网络模型包括双向长短期记忆网络模型。
[0022]根据本公开的实施例,从输入文本中分别生成事件的句法依存三元组和事件间的路径依存三元组包括:
[0023]利用句法依存树,从输入文本中分别提取第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系,生成句法依存三元组;
[0024]利用句法依存树,从输入文本中提取第二目标事件词;
[0025]根据第一目标事件词到第二目标事件词的路径,确定第一目标事件词与第二目标事件词之间的路径依存关系;
[0026]根据第一目标事件词、第二目标事件词以及第一目标事件词与第二目标事件词之间的路径依存关系,生成事件间的路径依存三元组。
[0027]根据本公开的实施例,事件时序关系分类模型通过最小化交叉熵损失函数训练得到。
[0028]本公开的第二方面提供了一种事件时序关系识别装置,包括:
[0029]全局语义信息获取模块,用于获取输入文本中的事件的全局语义信息,其中,文本至少包括两个事件,事件包括触发词和事件论元;
[0030]三元组生成模块,用于对输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组,其中,句法依存三元组包括:第一目标事件词、与第一目标事件词存在句法依赖的词以及句法依赖的关系;路径依存三元组包括:第一目标事件词、第二目标事件词、第一目标事件词与第二目标事件词之间的路径依存关系;
[0031]第一融合模块,用于将句法依存三元组和路径依存三元组融合,得到输入文本中的事件的关键信息;
[0032]先验知识的约束信息获取模块,用于根据事件时序类型的先验概率,获取事件的先验知识的约束信息;
[0033]第二融合模块,用于将事件的全局语义信息、事件的关键信息和事件的先验知识的约束信息融合,得到融合信息;以及
[0034]分类模块,用于将融合信息输入事件时序关系分类模型,得到事件的时序关系。
[0035]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述事件时序关系识别方法。
[0036]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述事件时序关系识别方法。
[0037]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述事件时序关系识别方法。
[0038]根据本公开的实施例,通过获取事件的全局语义信息;利用句法依存和路径依赖分析获取复杂句中事件的关键信息;通过加入先验知识,获取事件的先验知识的约束信息;将各信息融合并进行事件时序关系的分类。全局语义信息的获取保留了全局的信息;关键信息的获取,减少了冗余信息对事件时序关系判断的影响;事件的先验知识的约束信息的获取避免了事件时序的常识性错误,在分类过程中提升了模型性能;融合了关键信息、全局语义信息和先验知识的约束信息,保证了模型时序抽取的鲁棒性。实现了对事件时序关系的精准识别,进而实现了复杂句中事件时序关系抽取的任务,至少部分解决了现有方法过多依赖外部信息、通用性不强以及在长句中表现差的问题。
附图说明
[0039]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0040]图1示意性示出了根据本公开实施例的事件时序关系识别方法、装置、设备、介质和程序产品的应用场景图;
[0041]图2示意性示出了根据本公开实施例的事件时序关系识别方法的流程图;
[0042本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件时序关系识别方法,包括:获取输入文本中的事件的全局语义信息,其中,所述输入文本至少包括两个事件,所述事件包括触发词和事件论元;对所述输入文本进行处理,以分别生成事件的句法依存三元组和事件间的路径依存三元组,其中,所述句法依存三元组包括:第一目标事件词、与所述第一目标事件词存在句法依赖的词以及所述句法依赖的关系;所述路径依存三元组包括:第一目标事件词、第二目标事件词、所述第一目标事件词与所述第二目标事件词之间的路径依存关系;将所述句法依存三元组和所述路径依存三元组融合,得到所述输入文本中的事件的关键信息;根据事件时序类型的先验概率,获取事件的先验知识的约束信息;将所述事件的全局语义信息、所述事件的关键信息和所述事件的先验知识的约束信息融合,得到融合信息;以及将所述融合信息输入事件时序关系分类模型,得到所述事件的时序关系。2.根据权利要求1中所述的方法,其中,所述根据事件时序类型的先验概率,获取事件的先验知识的约束信息包括:利用百科类数据集计算所述事件时序类型出现的频数,以作为所述事件时序类型的先验概率;在所述先验概率满足阈值的情况下,确定所述事件时序类型的概率;将所述事件时序类型的概率映射为向量,得到所述事件的先验知识的约束信息。3.根据权利要求1中所述的方法,其中,所述获取输入文本中的事件的全局语义信息包括:获取所述输入文本的词列表和词性列表;利用预训练语言模型,将所述词列表表示为词嵌入向量,以及所述词性列表表示为词性嵌入向量;将所述词嵌入向量以及所述词性嵌入向量融合,得到融合嵌入向量;将所述融合嵌入向量输入神经网络模型,根据所述神经网络模型的隐藏层的输出确定所述输入文本中的事件的全局语义信息。4.根据权利要求3中所述的方法,其中,所述神经网络模型包括双向长短期记忆网络模型。5.根据权利要求1中所述的方法,其中,所述从所述输入文本中分别生成事件的句法依存三元组和事件间的路径依存三元组包括:利用句法依存树,从所述输入文本中分别提取所述第一目标事件词、所述与所述第一目标事件词存在句法依赖的词以及所述句法依赖的关...

【专利技术属性】
技术研发人员:李晓宇张泽群金力孙显马豪伟李树超靳盼盼
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1