一种基于重复历史事实的时序知识图谱案件推理方法技术

技术编号:35895741 阅读:14 留言:0更新日期:2022-12-10 10:29
一种基于重复历史事实的时序知识图谱案件推理方法,包括以下步骤:1)获取数据集中的头实体,关系,尾实体,时间戳;2)随机初始化实体、关系和时间戳的嵌入,LSTM和神经网络的参数;3)利用头实体,关系,尾实体,时间戳的嵌入,更新LSTM中的参数和神经网络,并通过历史词表惩罚历史中未出现的事实,具体过程如下所述。4)根据得到的LSTM网络和神经网络,该时间戳下已知头实体和关系预测尾实体或已知尾实体和关系预测头实体。与现有技术相比,本发明专利技术通过二维卷积聚合嵌入特征,LSTM和神经网络训练带有时间信息的特征,利用历史词表惩罚历史中未出现的事实,据此得到的时序知识图谱案件推理比现有的方法效果更好。比现有的方法效果更好。比现有的方法效果更好。

【技术实现步骤摘要】
一种基于重复历史事实的时序知识图谱案件推理方法


[0001]本专利技术属于人工智能领域,具体是涉及一种基于重复历史事实的时序知识图谱案件推理方法。

技术介绍

[0002]随着社会的不断发展,案件也变得越来越复杂,但随着大数据对个人信息更全面的搜集,为了能够得到更完整的案件流程,如身份证、地点、时间、交通工具等,这为时序知识图谱案件推理提供充足的数据集。目前主流的链接预测并不能很好的把重复历史事实信息结合到预测中,而案件往往呈现在重复地点使用同一交通工具犯罪,利用好这些信息可以大大提高知识图谱推理的准确性。本专利技术基于人工智能的发展,提出的一种基于重复历史事实的时序知识图谱案件推理方法可以帮助推理案件,从而减轻压力。

技术实现思路

[0003]为了克服现有技术的不足,为了减轻压力,本专利技术提出一种利用过去的四元组(头实体,关系,尾实体,时间戳)来训练LSTM和神经网络帮助推理案件的方法。
[0004]本专利技术解决其技术问题所采用的技术方案是:
[0005]一种基于重复历史事实的时序知识图谱案件推理方法,包括以下步骤:
[0006]1)获取数据集中的头实体,关系,尾实体,时间戳;
[0007]2)随机初始化实体、关系和时间戳的嵌入,LSTM和神经网络的参数;
[0008]3)利用头实体,关系,尾实体,时间戳的嵌入,更新LSTM中的参数和神经网络,并通过历史词表惩罚历史中未出现的事实,过程如下:
[0009]3.1)根据时序知识图谱中事实对应的时间戳的顺序,将时序知识图谱已知事实中的头实体,关系,尾实体,时间戳的嵌入输入二维卷积,公式如下:
[0010]M
τ
=Conv2d(h,r,τ);
[0011]M
τ
是τ时间戳下嵌入经过二维卷积提取特征后的特征向量,h,r,τ是实体、关系和时间戳的嵌入;
[0012]3.2)用二维卷积提取特征后的特征矩阵M
τ
训练LSTM,公式如下:
[0013]E
τ
=LSTM(M
τ
);
[0014]E
τ
是τ时间戳下经过LSTM训练后的特征向量;
[0015]3.3)用一层神经网络预测头实体或者尾实体,公式如下:
[0016]S
τ
=MLP(E
τ
);
[0017]S
τ
是神经网络预测的概率;
[0018]3.4)使用τ时间戳之前的历史事实生成历史词表,将实体和关系查询历史词表中是否存在过,若未存在过,做出惩罚;
[0019]P
τ
=S
τ

α*H
τ(h,r)
*|S
τ
|
[0020]P
τ
是经过历史词表惩罚过的概率,P
τ
是一个超参数,H
τ(h,r)
是历史词表。
[0021]3.5)使用交叉熵计算损失函数,公式如下:
[0022][0023]L
τ
(P,Q)是计算得出的交叉熵损失函数,Q
τ
是真实的结果;
[0024]3.6)重复更新神经网络直到更新次数到达最大迭代次数N或者5回合内MRR 不在提升;
[0025]4)根据得到的LSTM网络和神经网络,该时间戳下已知头实体和关系预测尾实体或已知尾实体和关系预测头实体,则执行3.1),3.2),3.3),得到P
τ
,并在P
τ
中获取最大概率的p
τ
,公式如下:
[0026]p
τ
=argmax(P
τ
)。
[0027]本专利技术的技术构思为:首先获取数据集中的头实体,关系,尾实体,时间戳,然后随机初始化学习率,图卷积神经网络中的节点参数和边参数,GRU的参数,以及头实体,关系,尾实体,时间戳的嵌入,并利用这些嵌入更新图卷积神经网络中的参数和神经网络。最后可以在该时间戳下已知头实体和关系预测尾实体或已知尾实体和关系预测头实体,该专利技术最终可以补充时序知识图谱。
[0028]本专利技术的有益效果为:通过用数据集训练图卷积神经网络,然后用训练好的神经网络用于预测头实体或者尾实体,从而可以补充时序知识图谱。
附图说明
[0029]图1显示了嵌入和神经网络训练流程图。
具体实施方式
[0030]下面结合附图对本专利技术作进一步描述。
[0031]参照图1,一种基于历史事实的时序知识图谱案件推理方法,包括以下步骤: 1)获取数据集中的头实体,关系,尾实体,时间戳;
[0032]2)随机初始化实体、关系和时间戳的嵌入,LSTM和神经网络的参数;
[0033]3)利用头实体,关系,尾实体,时间戳的嵌入,更新LSTM中的参数和神经网络,并通过历史词表惩罚历史中未出现的事实,过程如下:
[0034]3.1)根据时序知识图谱中事实对应的时间戳的顺序,将时序知识图谱已知事实中的头实体,关系,尾实体,时间戳的嵌入输入二维卷积,公式如下:
[0035]M
τ
=Conv2d(h,r,τ);
[0036]M
τ
是τ时间戳下嵌入经过二维卷积提取特征后的特征向量,h,r,τ是实体、关系和时间戳的嵌入;
[0037]3.2)用二维卷积提取特征后的特征矩阵M
τ
训练LSTM,公式如下:
[0038]E
τ
=LSTM(M
τ
);
[0039]E
τ
是τ时间戳下经过LSTM训练后的特征向量;
[0040]3.3)用一层神经网络预测头实体或者尾实体,公式如下:
[0041]S
τ
=MLP(E
τ
);
[0042]S
τ
是神经网络预测的概率;
[0043]3.4)使用τ时间戳之前的历史事实生成历史词表,将实体和关系查询历史词表中是否存在过,若未存在过,做出惩罚;
[0044]P
τ
=S
τ

α*H
τ(h,r)
*|S
τ
|
[0045]P
τ
是经过历史词表惩罚过的的概率,P
τ
是一个超参数,H
τ(h,r)
是历史词表。
[0046]3.5)使用交叉熵计算损失函数,公式如下:
[0047][0048]L
τ
(P,Q)是计算得出的交叉熵损失函数,Q
τ
是真实的结果;
[0049]3.6)重复更新神经网络直到更新次数到达最大迭代次数N=100或者5回合内 MRR不在提升;
[0050]4)根据得到的LSTM网络和神经网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于历史事实的时序知识图谱案件推理方法,其特征在于,所述方法包括以下步骤:1)获取数据集中的头实体,关系,尾实体,时间戳;2)随机初始化实体、关系和时间戳的嵌入,LSTM和神经网络的参数;3)利用头实体,关系,尾实体,时间戳的嵌入,更新LSTM中的参数和神经网络,并通过历史词表惩罚历史中未出现的事实,过程如下:3.1)根据时序知识图谱中事实对应的时间戳的顺序,将时序知识图谱已知事实中的头实体,关系,尾实体,时间戳的嵌入输入二维卷积,公式如下:M
τ
=Conv2d(h,r,τ);M
τ
是τ时间戳下嵌入经过二维卷积提取特征后的特征向量,h,r,τ是实体、关系和时间戳的嵌入;3.2)用二维卷积提取特征后的特征矩阵M
τ
训练LSTM,公式如下:E
τ
=LSTM(M
τ
);E
τ
是τ时间戳下经过LSTM训练后的特征向量;3.3)用一层神经网络预测头实体或者尾实体,公式如下:S
τ
=MLP(E
τ
);S
τ
是神经网络...

【专利技术属性】
技术研发人员:李永强林栋仇翔冯远静李文伟赵永智范陈强吴毕亮
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1