一种事件抽取方法、装置及设备制造方法及图纸

技术编号:35570525 阅读:38 留言:0更新日期:2022-11-12 15:54
本申请提供一种事件抽取方法、装置及设备,该方法包括:获取目标文本中的多个句子、多个句子中的多个实体和多个实体提及;确定与多个句子对应的初始句子向量、与多个实体对应的初始实体向量、与多个实体提及对应的初始实体提及向量;基于多个句子、多个实体和多个实体提及生成异质关系图谱,所述异质关系图谱包括句子、实体提及与实体之间的关联关系;基于异质关系图谱、初始句子向量、初始实体向量和初始实体提及向量,确定目标句子向量和目标实体向量;基于目标句子向量和目标实体向量确定目标文本对应的至少一条事件记录,事件记录包括用于描述同一事件的多个实体。通过本申请的技术方案,能够准确从文本中抽取出多种事件类型的多条事件记录。的多条事件记录。的多条事件记录。

【技术实现步骤摘要】
一种事件抽取方法、装置及设备


[0001]本申请涉及信息处理
,尤其涉及一种事件抽取方法、装置及设备。

技术介绍

[0002]事件抽取(Event Extraction,EE)是舆情管理领域和金融领域的重要任务之一,事件在金融领域是投资分析、资产管理的重要决策参考,事件也是知识图谱的重要组成部分,事件抽取是进行图谱推理、事件分析的必要过程。在大数据时代,数据信息的形式多样、错综复杂,难以挖掘和处理,难以利用和分析,为了从文本中提取更多有价值的信息,关键就是对文本中包含的实体、关系及事件进行抽取,对它们之间的作用关系进行分析和预测,以将提取的信息展现的更加系统化规范化。事件作为信息的表现形式之一,主要描述特定时间、地点、人和物相互作用的客观事实。事件抽取主要是从描述事件信息的文本中抽取出什么人、什么时间、在什么地点、做了什么事,以更加结构化的方式呈现。事件抽取作为主流的自然语言处理

任务,包括一系列抽取任务,如事件触发词的识别、事件类型的识别、事件论元及论元角色的提取等。但是,如何从文本中抽取出用于描述同一事件的实体,在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法,其特征在于,所述方法包括:获取目标文本中的多个句子、所述多个句子中的多个实体和多个实体提及;确定与所述多个句子对应的初始句子向量、与所述多个实体对应的初始实体向量、与所述多个实体提及对应的初始实体提及向量;基于所述多个句子、所述多个实体和所述多个实体提及生成异质关系图谱,所述异质关系图谱包括句子、实体提及与实体之间的关联关系;基于所述异质关系图谱、所述初始句子向量、所述初始实体向量和所述初始实体提及向量,分别确定所述初始句子向量对应的目标句子向量和所述初始实体向量对应的目标实体向量;基于所述目标句子向量和所述目标实体向量确定所述目标文本对应的至少一条事件记录,事件记录包括用于描述同一事件的多个实体。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个句子、所述多个实体和所述多个实体提及生成异质关系图谱,包括:构建与所述多个句子对应的多个句子节点、与所述多个实体对应的多个实体节点、与所述多个实体提及对应的多个实体提及节点;构建句子节点与句子节点之间的边关系;构建句子节点与实体提及节点之间的边关系;构建实体提及节点与实体提及节点之间的边关系;构建实体提及节点与实体节点之间的边关系。3.根据权利要求2所述的方法,其特征在于,在构建句子节点与句子节点之间的边关系时,针对任一句子,该句子对应的句子节点与该句子后面多个句子对应的句子节点具有边关系;在构建句子节点与实体提及节点之间的边关系时,若句子中包括实体提及,则该句子对应的句子节点与该实体提及对应的实体提及节点具有边关系;在构建实体提及节点与实体提及节点之间的边关系时,若两个实体提及处于同一句子,则两个实体提及对应的实体提及节点具有边关系;若两个实体提及具有相同事件角色,则两个实体提及对应的实体提及节点具有边关系;若两个实体提及表示同一实体,则两个实体提及对应的实体提及节点具有边关系;在构建实体提及节点与实体节点之间的边关系时,若实体提及对应实体,则该实体提及对应的实体提及节点与该实体对应的实体节点具有边关系。4.根据权利要求1所述的方法,其特征在于,所述基于所述异质关系图谱、所述初始句子向量、所述初始实体向量和所述初始实体提及向量,分别确定所述初始句子向量对应的目标句子向量和所述初始实体向量对应的目标实体向量,包括:基于所述异质关系图谱获取句子关系图谱、句子与实体提及关系图谱、实体提及与实体关系图谱;其中,所述句子关系图谱包括句子和句子之间的关联关系,所述句子与实体提及关系图谱包括句子和实体提及之间的关联关系,所述实体提及与实体关系图谱包括实体提及和实体之间的关联关系;基于所述句子关系图谱、所述句子与实体提及关系图谱、所述初始句子向量和所述初
始实体提及向量,确定所述初始句子向量对应的目标句子向量;基于所述实体提及与实体关系图谱、所述初始实体向量和所述初始实体提及向量,确定所述初始实体向量对应的目标实体向量。5.根据权利要求4所述的方法,其特征在于,所述基于所述句子关系图谱、所述句子与实体提及关系图谱、所述初始句子向量和所述初始实体提及向量,确定所述初始句子向量对应的目标句子向量,包括:基于所述句子关系图谱确定所述初始句子向量对应的关联句子向量,基于所述初始句子向量和所述关联句子向量确定第一节点注意力向量;基于所述第一节点注意力向量和所述关联句子向量确定句子间图谱融合特征;基于所述句子间图谱融合特征和所述初始句子向量确定第一图谱注意力向量;基于所述句子与实体提及关系图谱确定初始句子向量对应的初始实体提及向量,基于所述初始句子向量和所述初始实体提及向量确定第二节点注意力向量;基于第二节点注意力向量和初始实体提及向量确定句子提及间图谱融合特征;基于句子提及间图谱融合特征和初始句子向量确定第二图谱注意力向量;基于所述句子间图谱融合特征、第一图谱注意力向量、所述句子提及间图谱融合特征、第二图谱注意力向量和所述初始句子向量,确定目标句子向量。6.根据权利要求4所述的方法,其特征在于,所述基于所述实体提及与实体关系图谱、所述初始实体向量和所述初始实体提及向量,确定所述初始实体向量对应的目标实体向量,包括:基于所述实体提及与实体关系图谱确定初始实体向量对应的初始实体提及向量;基于所述初始实体向量和所述初始实体提及向量确定节点注意力向量;基于节点注意力向量和初始实体提及向量确定实体提及与实体间图谱融合特征;基于实体提及与实体间图谱融合特征和初始实体向量,确定目标实体向量。7.根据权利要求1所述的方法,其特征在于,所述基于所述目标句子向量和所述目标实体向量确定所述目标文本对应的至少一条事件记录,包括:基于所述目标句子向量确定所述目标文本对应的目标事件类型;确定所述目标事件类型对应的多个事件角色;针对每个事件角色,基于所述目标句子向量和所述目标实体向量,从所述多个实体中选取与所述事件角色对应的目标实体;基于每个事件角色对应的目标实体确定所述目标文本对应的事件记录。8.根据权利要求7所述的方法,其特征在于,所述基于所述目标句子向量确定所述目标文本对应的目标事件类型,包括:针对事件类型列表中的每个事件类型,将所述目标句子向量输入给已训练的事件类型识别模型,得到所述事件类型对应的预测概率;若所述预测概率大于预设阈值,则确定所述事件类型为目标事件类型;若所述预测概率不大于预设阈值,则确定所述事件类型不为目标事件类型。9.根据权利要求7所述的方法,其特征在于,所述针对每个事件角色,基于所述目标句子向量和所述目标实体向量,从所述多个实体中选取与所述事件角色对应的目标实体,包括:
确定与所述事件角色对应的路径表征矩阵,所述路径表征矩阵包括所述事件角色前面的各事件角色对应的目标实体对应的特征向量;在所述目标文本对应多个目标事件类型时,确定记忆矩阵,所述记忆矩阵包括所述目标文本对应的多个目标事件类型的路径表征矩阵,一个路径表征矩阵对应一条事件记录中所有事件角色对应的目标实体对应的特征向量;基于所述目标句子向量、所述目标实体向量、所述路径表征矩阵和所述记忆矩阵,从所述多个实体中选取与所述事件角色对应的目标实体;或者,基于所述目标句子向量、所述目标实体向量和所述路径表征矩阵,从所述多个实体中选取与所述事件角色对应的目标实体。10.根据权利要求9所述的方法,其特征在于,所述基于所述目标句子向量、所述目标实体向量、所述路径表征矩阵和所述记忆矩阵,从所述多个实体中选取与所述事件角色对应的目标实体,包括:针对每个实体,将所述目标句子向量、所述目标实体向量、所述路径表征矩阵和所述记忆矩阵输入给分类器模型,得到所述实体对应的预测概率;若所述预测概率大于预设阈值,则确定所述实体为所述事件角色对应的目标实体,否则,确定所述实体不为所述事件角色对应的目标实体。11.根据权利要求1或7所述的方法,其特征在于,所述基于所述目标句子向量和所述目标实体向量确定所述目标文本对应的至少一条事件记录之后,所述方法还包括:在目标页面展示所述目标文本对应的事件记录;和/或,在目标知识图谱中存储所述目标文本对应的事件记录;和/或,若所述目标文本对应的事件记录与目标感兴趣信息匹配,则将所述目标文本对应的信息推送给所述目标感兴趣信息对应的目标设备。12.一种事件抽...

【专利技术属性】
技术研发人员:张浩俞颖晔邢金彪
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1