用于预测未来事件的方法、系统、计算设备和可读介质技术方案

技术编号:33376750 阅读:18 留言:0更新日期:2022-05-11 22:44
本发明专利技术公开了用于预测未来事件的方法、系统、计算设备和可读介质,方法包括:获取要预测的未来事件的四元组中的三元素,所述三元素包括时间戳、主体要素和类型要素,其中所述四元组中的客体要素是未知的;对所述时间戳进行编码,获取所述时间戳的时间向量表示;使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的主体向量表示和所述类型要素的类型向量表示;以及基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果。本发明专利技术能够获取实体节点和事件类型的语义表示,增强了语义表达能力,并且能够预测未来可能发生的新事件。新事件。新事件。

【技术实现步骤摘要】
用于预测未来事件的方法、系统、计算设备和可读介质


[0001]本专利技术涉及人工智能
,更具体地,涉及用于预测未来事件的方法、系统、计算设备和可读介质。

技术介绍

[0002]随着科学技术的发展,互联网上的信息瞬息万变。面对复杂多变的事件发展,舆情分析人员需要在实时事件信息的支撑下快速判断热点事件的后续发展方向,从而对可能造成严重社会影响的事件进行预警,这对分析人员认知舆情热点事件、给出事件发展方向的能力提出了更高的要求。长期以来,预测事件发展方向主要通过专业的舆情分析人员对互联网热点事件信息进行汇总分析并结合自身专业经验完成,通常会花费大量的时间在人工对实时事件信息的梳理分析上。随着自媒体时代的到来,完全依靠人工完成热点事件后续发展分析,无法快速预警可能造成严重社会影响的事件,可能会带来重大损失。
[0003]现有的用于预测事件发展方向的机器模型主要有两种:CyGNet模型和CluSTeR模型。
[0004]其中,CyGNet模型提出了一种基于时间感知的具有复制

生成机制的事件预测方法,该方法能够从整个意图空间中预测未来事件,能够通过学习重复的历史事件,从历史事件中来选择未来会出现的事件。但是,CyGNet模型未考虑每个实体节点本身所蕴含的语义信息,也未建模不同实体节点之间的关联,未将已经出现的历史事件构成图结构,学习图结构中的语义信息,从而模型的语义表达能力较差。
[0005]CluSTeR模型根据决策双系统理论,将未来事件预测分解成线索搜索和时序推理两个阶段,先检索相关的历史线索信息,得到候选答案,然后考虑线索的时序信息,从候选答案中挑选出最优结果。但是,CluSTeR模型检索相关历史数据形成候选答案的方式限制了模型的答案域,也就是模型的预测结果只能出现在已知的历史事件中,而不能预测新的事件。此外,CluSTeR模型也没有考虑实体节点和事件边所蕴含的语义信息,从而模型的语义表达能力较差。
[0006]因此,需要一种新型的用于预测未来事件的方法、系统、计算设备和可读介质,以解决上述问题。

技术实现思路

[0007]在
技术实现思路
部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本专利技术的
技术实现思路
部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
[0008]根据本专利技术的一方面,提供了一种用于预测未来事件的方法,所述方法包括:获取要预测的未来事件的四元组中的三元素,所述三元素包括时间戳、主体要素和类型要素,其中所述四元组中的客体要素是未知的;对所述时间戳进行编码,获取所述时间戳的时间向量表示;使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素
的主体向量表示和所述类型要素的类型向量表示;以及基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果。
[0009]在一个实施例中,其中对所述时间戳进行编码,包括:对所述时间戳中的年、月、日分别进行编码,得到所述年、月、日各自的向量表示;以及对所述年、月、日各自的向量表示进行融合,得到所述时间戳的时间向量表示。
[0010]在一个实施例中,其中使用经训练的预训练语言模型和经训练的图神经网络模型得到所述主体要素的主体向量表示,包括:使用经训练的预训练语言模型得到所述主体要素的文本语义向量;使用经训练的图神经网络模型得到所述主体要素的图结构语义向量;以及将所述主体要素的文本语义向量和图结构语义向量进行融合,得到所述主体要素的主体向量表示。
[0011]在一个实施例中,其中使用经训练的预训练语言模型和经训练的图神经网络模型得到所述类型要素的类型向量表示,包括:使用经训练的预训练语言模型得到所述类型要素的文本语义向量;使用经训练的图神经网络模型得到所述类型要素的图结构语义向量;以及将所述类型要素的文本语义向量和图结构语义向量进行融合,得到所述类型要素的类型向量表示。
[0012]在一个实施例中,其中基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果,包括:基于注意力机制对所述时间向量表示、主体向量表示和类型向量表示进行融合,得到所述未来事件的事件向量表示;以及基于所述事件向量表示得到对所述未来事件的客体要素的预测结果。
[0013]在一个实施例中,所述方法还包括:采用包含外部知识的训练数据对预训练模型进行训练,得到所述经训练的预训练语言模型。
[0014]在一个实施例中,所述包含外部知识的训练数据通过以下步骤获得:采用实体链接算法获取存储的历史事件的四元组的主体要素在领域知识图谱中的相应的实体节点;利用所述实体节点与所述实体节点的相关知识组成知识三元组,作为所述外部知识;基于所述知识三元组和与所述历史事件的三元组从语料库中检索相关文本,其中所述历史事件的三元组由所述历史事件的四元组去掉时间戳而得到;以及对所述相关文本进行处理,得到所述包含外部知识的训练数据。
[0015]在一个实施例中,其中所述实体节点的相关知识包括所述实体节点的一跳之内的知识。
[0016]在一个实施例中,其中对所述相关文本进行处理,包括:将所述相关文本中包含的与所述知识三元组和所述历史事件的三元组相对应的主体要素和客体要素中的至少一个作为训练数据的标签。
[0017]在一个实施例中,其中对预训练模型进行训练包括:将所述预训练模型训练为预测两个句子是否来自同一段落。
[0018]在一个实施例中,所述方法还包括:采用实体链接算法获取存储的历史事件的四元组的主体要素在领域知识图谱中的相应的实体节点;利用所述实体节点与所述实体节点的相关知识组成知识三元组;将所述历史事件的四元组去掉时间戳,得到所述历史事件的历史事件图谱;将所述知识三元组与所述历史事件图谱相结合,得到经更新的历史事件图谱;以及利用所述经更新的历史事件图谱作为训练数据对图神经网络模型进行训练,得到
所述经训练的图神经网络模型。
[0019]根据本专利技术的另一方面,提供了一种用于预测未来事件的系统,所述系统包括:处理器,用于使用一个或更多个神经网络:获取要预测的未来事件的四元组中的三元素,所述三元素包括时间戳、主体要素和类型要素,其中所述四元组中的客体要素是未知的;对所述时间戳进行编码,获取所述时间戳的时间向量表示;使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的主体向量表示和所述类型要素的类型向量表示;基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果,存储器,用于存储所述一个或更多个神经网络的网络参数。
[0020]根据本专利技术的又一实施例,提供了一种计算设备,所述计算设备包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行如上所述的方法。
[0021]根据本专利技术的再一实施例,提供了一种计算机可读介质,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于预测未来事件的方法,其特征在于,所述方法包括:获取要预测的未来事件的四元组中的三元素,所述三元素包括时间戳、主体要素和类型要素,其中所述四元组中的客体要素是未知的;对所述时间戳进行编码,获取所述时间戳的时间向量表示;使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的主体向量表示和所述类型要素的类型向量表示;以及基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果。2.如权利要求1所述的方法,其特征在于,其中对所述时间戳进行编码,包括:对所述时间戳中的年、月、日分别进行编码,得到所述年、月、日各自的向量表示;以及对所述年、月、日各自的向量表示进行融合,得到所述时间戳的时间向量表示。3.如权利要求1所述的方法,其特征在于,其中使用经训练的预训练语言模型和经训练的图神经网络模型得到所述主体要素的主体向量表示,包括:使用经训练的预训练语言模型得到所述主体要素的文本语义向量;使用经训练的图神经网络模型得到所述主体要素的图结构语义向量;以及将所述主体要素的文本语义向量和图结构语义向量进行融合,得到所述主体要素的主体向量表示。4.如权利要求1所述的方法,其特征在于,其中使用经训练的预训练语言模型和经训练的图神经网络模型得到所述类型要素的类型向量表示,包括:使用经训练的预训练语言模型得到所述类型要素的文本语义向量;使用经训练的图神经网络模型得到所述类型要素的图结构语义向量;以及将所述类型要素的文本语义向量和图结构语义向量进行融合,得到所述类型要素的类型向量表示。5.如权利要求1所述的方法,其特征在于,其中基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果,包括:基于注意力机制对所述时间向量表示、主体向量表示和类型向量表示进行融合,得到所述未来事件的事件向量表示;以及基于所述事件向量表示得到对所述未来事件的客体要素的预测结果。6.如权利要求1所述的方法,其特征在于,所述方法还包括:采用包含外部知识的训练数据对预训练模型进行训练,得到所述经训练的预训练语言模型。7.如权利要求6所述的方法,其特征在于,所述包含外部知识的训练数据通过以下步骤获得:采用实体链接算法获取存储的历史事件的四元组的主体要素在领域知识图谱中的相应的实体节点;利用所述实体节点与所述实体节点的相关知识组成知识三元...

【专利技术属性】
技术研发人员:徐承张浩宇吴飞方四安柳林
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1