基于两步式框架的有向超图链式预测方法技术

技术编号：35819692 阅读：23 留言：0更新日期：2022-12-03 13:44

本发明专利技术公开了基于两步式框架的有向超图链式预测方法，获取具有多个实体间关系的有向超图；将有向超图输入神经网络模型进行训练，获取节点集中每个节点的嵌入向量后，利用基于Tucker分解的评分函数获得两种评分来评估超边是否存在；BiLSTM模型生成一个包含所有顺序信息的嵌入向量；同样的过程发生在反向隐藏层组中，得到两个不同的嵌入向量；将两个嵌入向量连接成一个向量，得到超边表示，发送到Softmax层获得方向分数；使用梯度下降法更新模型参数。本发明专利技术将Tucker分解推广到高维，引入张量环分解算法来降低模型的复杂度，从理论上证明了为超边评分的模积结果与参与计算的节点顺序无关。节点顺序无关。节点顺序无关。

全部详细技术资料下载

【技术实现步骤摘要】
基于两步式框架的有向超图链式预测方法

[0001]本专利技术属于人工智能
，尤其涉及基于两步式框架的有向超图链式预测方法。

技术介绍

[0002]链式预测有助于放大图结构数据中的关系，受到学术界和工业界的广泛关注。现有的研究主要集中在简单图的链式预测上，用一条边来表示两个节点之间的关系，这在处理现实世界的实际情况时可能不够。在现实世界中一个关系(即边)可能涉及两个以上的实体(即节点)，例如化学反应、共同作者关系和社会网络等等。换句话说，这些是典型的高阶关系。图1(a)显示了一个玩具化学反应网络的例子。从图中可以看出，一个完整的反应由CuO、H2SO4、H2O、CuSO4等几个化合物组成，且化合物之间存在高阶关系，这种高阶关系定义了如下反应：
[0003]CuO+H2SO4→
H2O+CuSO4[0004]因此，最近的一种研究趋势是将高阶关系建模为超边，从而产生超图。可以看出，一个超边可以覆盖多个节点，如图1(a)中反应I的5个节点和反应II的4个节点。经过这样的扩展，图模型能够自适应地处理包含多个节点的高阶关系，而不仅仅是三元组的关系。
[0005]传统的面向简单图的链式预测方法无法捕捉到这种高阶关系，与简单图相比，它具有更大的挑战性。首先，链接中每个节点的表示对超链接的预测都有影响。因此，在进行预测时，一个好的表示模型需要考虑到一个链接中涉及的所有单个节点的表示。其次，由于对超图的人工标注大多数都十分复杂，因此很多情况下对超图的预测缺乏足够的训练数据，这就导致数据量不足以很好地训练大量...

【技术保护点】

【技术特征摘要】
1.基于两步式框架的有向超图链式预测方法，其特征在于，包括以下步骤：获取具有多个实体间关系的有向超图，其中超图的一条边涉及两个以上的实体；将有向超图输入神经网络模型进行两个阶段的训练，其中第一阶段的训练以节点的初始嵌入向量及其标签为输入，获取节点集中每个节点的嵌入向量后，利用基于Tucker分解的评分函数获得两种评分来评估超边是否存在，并使用二元交叉熵损失函数以最大限度地提高两者的差距，模型训练的目标是使已有超边的得分大于不存在超边的节点集的得分；如果超边存在，根据每个节点的方向标签将节点集分成两组，将有向超边中的节点根据标签分为头尾两部分，并按照特定的顺序输入到BiLSTM层；在第一阶段的模型训练完成后，获取更新后的核心张量和嵌入向量，并利用这些嵌入量初始化第二阶段的BiLSTM模型，BiLSTM模型包括两组端到端但方向相反的LSTM隐藏层，在正向隐藏层组的隐藏层中，逐个计算超边中的节点嵌入向量的状态，同时在下一隐含层中计算前一隐含层的状态，并将隐藏层状态馈入相应隐藏层的节点嵌入向量的计算中；计算出所有隐藏层之后，生成一个包含所有顺序信息的嵌入向量；同样的过程发生在反向隐藏层组中，得到两个不同的嵌入向量；将两个嵌入向量连接成一个向量，得到超边表示，然后将其发送到Softmax层以获得方向分数；基于BiLSTM的模型使用梯度下降法更新模型参数以及节点和关系的嵌入，对输入的新有向超图，输出新有向超图中超边的存在和/或推断存在的超边的方向。2.根据权利要求1所述的基于两步式框架的有向超图链式预测方法，其特征在于，所述有向超图是一个化学信息学或生物信息学中的有序对H＝(V,E)，其中V＝{v1，
…
，v
l
}为节点集合，l为节点个数，E包括一组有指向的超边：E＝{(h1,t1),(h2,t2),
…
,(h
m
,t
m
)}E中的每个元素分成两个分量，其中h
m
为第m个元素的头，t
m
为第m个元素的尾，超边的方向是从头到尾；有向超边预测的目标是根据给定节点的相关性预测缺失超边的存在性和关联方向。3.根据权利要求1所述的基于两步式框架的有向超图链式预测方法，其特征在于，根据每组节点的顺序不影响方向的特点，对每组节点随机排序，增加训练数据；保持两个组分的顺序，并随机洗牌同一个组分中的节点；生成的实例数量取决于每个组件拥有的节点数量；给所有生成的数据实例一个正确的标签，以强制BiLSTM利用方向的特性。4.根据权利要求1所述的基于两步式框架的有向超图链式预测方法，其特征在于，所述Tucker分解将高阶张量分解为一个核心张量和几个因子矩阵，具体形式表示如下：X＝(Ω,U
(1)
,U
(2)
,...,U
(k)
)＝Ω
×1U
(1)
×2U
(2)
...
×
k
U
(k)
其中，X表示原始张量，Ω表示核心张量，k表示X的模态数，(U
(1)
，
…
，U
(1)
)表示因子矩阵集合，数学符号k表示沿第k阶模的张量积，核心张量的维数每一阶都比原始张量的维数小，因此将核张量视为原始张量的降维表示。5.根据权利要求1所述的基于两步式框架的有向超图链式预测方法，其特征在于，存在一个节点数最多为n的超图，将其定义为(n+1)阶张量Y，将Y分解为一个核心张量和几个矩阵的模积：y＝Z<...

【专利技术属性】
技术研发人员：肖冠辰，赵翔，谭真，廖劲智，葛斌，汤俊，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人