一种基于特征交互神经张量网络的图结构数据相似度计算方法技术

技术编号:33156590 阅读:20 留言:0更新日期:2022-04-22 14:13
本发明专利技术公开了一种基于特征交互神经张量网络的图结构数据相似度计算方法,即DeepSIM模型,属于深度学习领域,首先使用共享权值的图卷积层构建孪生图卷积模块用以获得两个图结构数据的一对节点级嵌入。然后将这一对节点级嵌入输入图注意力层以聚合节点级信息得到图级嵌入。针对图级嵌入,本发明专利技术提出的FINTN能够有效推理二者之间的关联并输出固定维度的关系向量。这一关系向量输入到由全连接层构成的结果输出模块得到预测输出。这一预测输出与实际的标签值进行比较,通过损失函数和反向传播算法对整体模型参数进行更新以达学习的目的。完成训练的DeepSIM模型能高效可靠地计算输入的两个图结构数据的相似度。输入的两个图结构数据的相似度。输入的两个图结构数据的相似度。

【技术实现步骤摘要】
一种基于特征交互神经张量网络的图结构数据相似度计算方法


[0001]本方法属于深度学习领域,主要用于图结构数据相似度计算。相较于神经张量网络的关系推理方法(Neural TensorNetwork,以下简称NTN),提出新的特征张量交互方法并构建特征交互神经张量网络(Feature Interactive Neural TensorNetwork,以下简称FINTN)。这一网络可以很好地推理成对嵌入之间的关系,通过学习的方式生成固定维度的向量化表示,极大地提高了图结构数据相似度计算的准确性。

技术介绍

[0002]图结构数据相似度计算在工业、生物、医疗、制药等领域有着很广泛的应用,例如:根据计算与已知蛋白质的结构相似度判断未知蛋白质所属的类。但图结构数据是高维结构,难以通过传统的距离度量直接描述二者的相似程度,图的表示学习就成为这一领域的研究热点。深度学习领域的一个重要研究方向就是数据的表示学习,即通过一系列的神经网络特征提取技术(如:卷积神经网络、循环神经网络等)将数据映射到特征空间并以向量的形式表现数据的特征,这一过程称为嵌入。这类特征可以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于特征交互神经张量网络的图结构数据相似度计算方法,其特征在于:执行步骤如下:步骤1、步骤1、获取公开图结构数据集数据集并标签值计算与训练集、测试集划分;步骤2、将训练数据输入模型,通过孪生图卷积层和图注意力层生成图级嵌入;步骤3、调用特征交互神经张量网络对两个图级嵌入关系进行推理,生成易于计算的固定维度关系向量;步骤4、调用结果输出模块接收步骤3输出的关系向量进行结果预测;步骤5、调用步骤5中生成的DeepSIM模型并用测试集进行测试,当预测的MSE值符合预期值时,保存模型,此模型在后续使用中只需输入待测数据即可实现计算;2.根据权利要求1所述的一种基于特征交互神经张量网络的图结构数据相似度计算方法,步骤1的实现过程如下:公开的图结构数据集仅包含原始的图结构数据而不包括成对的相似度标签,故对公开数据集进行两两分组并调用NetworkX库中的图编辑距离算法进行标签生成,生成后的的数据按一定比例(如3:1)进行训练集、测试集划分。3.根据权利要求1所述的一种基于特征交互神经张量网络的图结构数据相似度计算方法,步骤2的实现过程如下:图卷积神经网络负责图结构嵌入生成,为了提高图卷积效率,使用参数化切比雪夫图卷积方法作...

【专利技术属性】
技术研发人员:刘博王志晗张冀东武嘉慧
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1