一种面向逻辑多态性的事理图谱表示学习方法及系统技术方案

技术编号:35455124 阅读:31 留言:0更新日期:2022-11-03 12:11
本发明专利技术提供了一种面向逻辑多态性的事理图谱表示学习方法及系统,所述事理图谱表示学习方法包括:对事理图谱中的节点进行向量化,以得到初步的向量表示;采用树状结构构建由事件组成的复合事件;考虑事件之间的逻辑关系,使用周期函数作为事件对置信度映射函数,对所述复合事件的事理逻辑进行建模;选择负采样策略对所述复合事件进行负采样;使用marginloss作为损失函数训练事件嵌入。本发明专利技术通过提出使用树状结构对事件组合进行建模,并采用周期函数作为事件得分的方式,既保证了模型对于复杂事件的表达能力,又保证了每个事件的嵌入质量,以适用于不同场景下的下游任务。以适用于不同场景下的下游任务。以适用于不同场景下的下游任务。

【技术实现步骤摘要】
一种面向逻辑多态性的事理图谱表示学习方法及系统


[0001]本专利技术涉及知识图谱
,尤其涉及一种面向逻辑多态性的事理图谱表示学习方法及系统。

技术介绍

[0002]知识图谱的表示学习是一种将一组实体及实体之间的关系嵌入到低维稠密的向量空间中,使得机器可以此为依据快速进行推理或预测的技术手段,知识图谱的表示学习在阅读理解、推荐系统和QA等下游任务中得到了广泛应用。
[0003]但是,目前由于传统知识图谱缺乏事件粒度上的表示,导致其很难进行事件的预测和推理,所以使用事理图谱对以事件作为基本单位的事实进行建模,以更好地适应这种场景。由于事件之间存在大量的事理逻辑,如因果关系、共存关系和矛盾关系等,事件之间通过这些事理逻辑进行联系和组合。在不同的先验知识下,事件的状态会通过事理逻辑组合链进行传播,所构建的事理图谱也相应的会存在不同的状态,称之为事理图谱的多态性。
[0004]多态性的事理图谱在嵌入过程中会产生一个问题,即在以非凸函数作为得分函数的训练模型中,事件的嵌入在多种逻辑规则的约束下,在向量空间中的位置会随着训练过程而不断发生变化。由于有的事件与其他事件之间会存在很多种逻辑约束,这些逻辑规则又有很多种组合方式,这会导致事件嵌入变化常常不能兼顾所有约束,最后难以获得良好的模型训练效果。

技术实现思路

[0005]为了克服上述现有技术的不足,本专利技术提供了一种面向逻辑多态性的事理图谱表示学习方法及系统,通过使用树状结构对事件组合进行建模,并采用周期函数作为事件得分的方式,既保证了训练模型对于复杂事件的表达能力,又保证了每个事件的嵌入质量,以适用于不同场景下的下游任务。
[0006]为解决上述问题,本专利技术的第一目的在于提供一种面向逻辑多态性的事理图谱表示学习方法,所述事理图谱表示学习方法包括:
[0007]S
100
:对事理图谱中的节点进行向量化,以得到初步的向量表示;
[0008]S
200
:采用树状结构构建由事件组成的复合事件;
[0009]S
300
:考虑事件之间的逻辑关系,使用周期函数作为事件对置信度映射函数,对所述复合事件的事理逻辑进行建模;
[0010]S
400
:选择负采样策略对所述复合事件进行负采样;
[0011]S
500
:使用margin loss作为损失函数训练事件嵌入。
[0012]可选的,在步骤S
100
中,所述对事理图谱中的节点进行向量化具体包括:
[0013]S
110
:获取三元组的嵌入表示;
[0014]所述获取三元组的嵌入表示具体包括:选择TransE模型对事理图谱进行表示学习,以得到训练后的三元组嵌入模型;
[0015]所述三元组嵌入模型包括头实体嵌入、关系嵌入和尾实体嵌入,所述三元组嵌入模型的距离公式表示为:
[0016][0017]其中:(head,rel,tail)表示一个三元组,head代表实体嵌入,rel代表实体嵌入,tail代表实体嵌入;
[0018]S
120
:获取基础事件的嵌入;
[0019]所述基础事件的嵌入公式如下:Δ=f(h,r,t)
[0020]其中:

表示事件嵌入,h、r、t分别表示三元组中头实体、关系、尾实体的嵌入表示,f()表示融合操作。
[0021]可选的,在步骤S
110
中,所述获取三元组的嵌入表示的嵌入方法包括融合事实信息的方法和融合附加信息的方法。
[0022]可选的,在步骤S
110
中,所述三元组的嵌入表示的损失函数为:
[0023][0024]其中:E表示事理图谱中的实体集合,R表示关系集合,(h

,r,t

)表示进行随机负采样后的三元组。
[0025]可选的,在步骤S
200
中,所述复合事件的嵌入表示为:
[0026]Δ1=f(h1,r1,t1)
[0027]Δ2=f(h2,r2,t2)
[0028]Δ
12
=g(Δ1,Δ2)
[0029]其中:Δ1和Δ2分别表示两个事件的嵌入,f()表示融合操作,Δ
12
表示由Δ1和Δ2组成的复合事件,g()表示取均值操作。
[0030]可选的,在步骤S
400
中,所述选择负采样策略对所述复合事件进行负采样具体包括:
[0031]S
410
:在负采样时,考虑事件是否是复合事件;
[0032]S
420
:定义由单一三元组组成的事件为一阶事件,以此类推,并表示如下:
[0033]Δ1=f(h1,r1,t1),
[0034]Δ
12
=g(Δ1,Δ2),
[0035]Δ
123
=g(g(Δ1,Δ2),Δ3),
[0036]Δ
1234
=g(g(Δ1,Δ2),g(Δ3,Δ4))
[0037]其中:Δ1是一阶事件,Δ
12
是二阶事件,Δ
123
和Δ
1234
都是三阶事件;
[0038]S
430
:对事件对进行动态采样。
[0039]可选的,在步骤S
500
中,所述损失函数margin loss的计算表达式如下:
[0040][0041]其中:(Δ1,Δ
′2)表示负采样之后的三元组,γ是分隔系数。
[0042]本专利技术的第二目的在于提供一种面向逻辑多态性的事理图谱表示学习系统,所述系统包括:
[0043]事件节点向量化模块,用于对事理图谱中的节点进行向量化;
[0044]复合事件表示模块,用于采用树状结构对复合事件进行表示;
[0045]事理逻辑建模器,用于分析事件之间的逻辑关系,并使用周期函数作为事件对置信度映射函数,将事件对拟合到合适的波峰;
[0046]负采样模块,用于对对事件对中的事件进行随机替换,对事件对进行在线动态采样;
[0047]事件嵌入模块,用于训练事件嵌入。
[0048]本专利技术的第三目的在于提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器用于存储支持所述处理器执行权利要求1至7任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
[0049]本专利技术的第四目的在于提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述所述的面向逻辑多态性的事理图谱表示学习方法。
[0050]本专利技术与现有技术相比具有显著的优点和有益效果,具体体现在以下方面:
[0051]本专利技术使用树状结构对事件组合进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向逻辑多态性的事理图谱表示学习方法,其特征在于,所述事理图谱表示学习方法包括:S
100
:对事理图谱中的节点进行向量化,以得到初步的向量表示;S
200
:采用树状结构构建由事件组成的复合事件;S
300
:考虑事件之间的逻辑关系,使用周期函数作为事件对置信度映射函数,对所述复合事件的事理逻辑进行建模;S
400
:选择负采样策略对所述复合事件进行负采样;S
500
:使用margin loss作为损失函数训练事件嵌入。2.根据权利要求1所述的面向逻辑多态性的事理图谱表示学习方法,其特征在于,在步骤S
100
中,所述对事理图谱中的节点进行向量化具体包括:S
110
:获取三元组的嵌入表示;所述获取三元组的嵌入表示具体包括:选择TransE模型对事理图谱进行表示学习,以得到训练后的三元组嵌入模型;所述三元组嵌入模型包括头实体嵌入、关系嵌入和尾实体嵌入,所述三元组嵌入模型的距离公式表示为:其中:(head,rel,tail)表示一个三元组,head代表实体嵌入,rel代表实体嵌入,tail代表实体嵌入;S
120
:获取基础事件的嵌入;所述基础事件的嵌入公式如下:Δ=f(h,r,t)其中:

表示事件嵌入,h、r、t分别表示三元组中头实体、关系、尾实体的嵌入表示,f()表示融合操作。3.根据权利要求2所述的面向逻辑多态性的事理图谱表示学习方法,其特征在于,在步骤S
110
中,所述获取三元组的嵌入表示的嵌入方法包括融合事实信息的方法和融合附加信息的方法。4.根据权利要求2所述的面向逻辑多态性的事理图谱表示学习方法,其特征在于,在步骤S
110
中,所述三元组的嵌入表示的损失函数为:其中:E表示事理图谱中的实体集合,R表示关系集合,(h

,r,t

)表示进行随机负采样后的三元组。5.根据权利要求1所述的面向逻辑多态性的事理图谱表示学习方法,其特征在于,在步骤S
200
中,所述复合事件的嵌入表示为:Δ1=f(h1,r1,t1)Δ2=f(h2,r2,t2)...

【专利技术属性】
技术研发人员:董理君姜家伟李新川姚宏刘超梁庆中
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1