一种基于异质图神经网络的图谱频繁关系模式挖掘方法技术

技术编号：33548802 阅读：24 留言：0更新日期：2022-05-26 22:44

本发明专利技术公开了一种基于异质图神经网络的图谱频繁关系模式挖掘方法，其提出了一种描述和提取节点范围内结构的异质图神经网络模型，旨在挖掘其中的频繁关系模式以及各关系模式的结构分布。该模型将关系信息作为节点特征输入，利用自编码机制与多头注意力机制保留原始结构信息，同时引入特征结构平移层将相同结构映射到同一空间中，以获得频繁出现的结构。实验结果表明，该模型可以更快地挖掘图谱关系模式以及各结构在图中的分布；同时在验证特征表达能力的链接预测任务中有稳定表现，在关系类型较多的异质图中甚至优于部分联合学习模型。型较多的异质图中甚至优于部分联合学习模型。型较多的异质图中甚至优于部分联合学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于异质图神经网络的图谱频繁关系模式挖掘方法

[0001]本专利技术涉及异质图神经网络
，特别涉及一种基于异质图神经网络的图谱频繁关系模式挖掘方法。

技术介绍

[0002]知识图谱是一种反映客观世界实体之间关系的语义网络，蕴含丰富的关系模式，根据这些关系模式又可总结出实体与概念之间的类属关系以及概念与概念之间的上下位关系，从而完善概念知识图谱。例如附图1所示，在图谱中存在大量“主演”、“导演”相关三元组，这些信息经挖掘后可以获得一般性的知识前提，在图谱中表现为频繁出现的关系结构，为实体类型的预测(判断含有“主演”、“导演”等关系的某实体可能是某部电影等)以及知识推理(某部电影的主演与导演可能存在“合作”关系等)、推荐系统(可能对某电影导演的另一部电影感兴趣)和智能问答(了解某个演员参演过的电影)等各类任务打下基础。
[0003]针对传统遍历算法复杂度高、计算困难的特点，图挖掘技术为我们提供一种新的解决思路。相较于传统的同质图，具有不同类型节点(实体)和边(关系)的异质图，例如知识图谱等蕴含信息更多，也有更高...

【技术保护点】

【技术特征摘要】
1.一种基于异质图神经网络的图谱频繁关系模式挖掘方法，其特征在于，包括以下步骤：步骤1：获取待学习有向异质图G
H
(V,E)；步骤2：构建异质图神经网络模型；步骤3：将异质图G
H
(V,E)输入到构建好的异质图神经网络模型，挖掘频繁出现的关系模式；步骤4：基于步骤3得到的关系模式进行实体类型预测或知识推理。2.如权利要求1所述的一种基于异质图神经网络的图谱频繁关系模式挖掘方法，其特征在于，步骤2构建的异质图神经网络模型包括特征输入层、双通道自动编码层、多头注意力层以及特征结构平移层；所述特征输入层为异质图神经网络模型的输入端，用于将边或关系的类别、方向信息映射到同一空间并进行节点级别的表示；所述双通道自动编码层连接在特征输入层之后，用于对特征进行筛选并降维；所述多头注意力层连接在双通道自动编码层后，用于接收降维后的结果，其引入多头注意力机制通过消息传递获得一定范围内的结构信息，实现该范围内的结构感知；所述特征结构平移层连接在多头注意力层后，其是基于传统卷积神经网络的平移不变性得出的特征结构平移机制，用于输出异质图中的频繁模式以及各结构的分布。3.如权利要求2所述的一种基于异质图神经网络的图谱频繁关系模式挖掘方法，其特征在于，所述特征输入层将边或关系相关信息映射到同一空间并进行节点级别的表示的具体步骤为：针对异质图中某个非孤立节点Node
i
而言，从Node
i
指出的边用向量Out
i
表示，指向Node
i
的边用向量In
i
表示，出边存在的每一种状态，即在Out
i
的相应位置将该状态置为1，入边同理，将最后将Out
i
与In
i
按行拼接为一个2N维的新向量，并记为Vec
i
；针对孤立节点，其向量以全零表示；最终将输入的不同类型的异质边映射到同一空间中。4.如权利要求2所述的一种基于异质图神经网络的图谱频繁关系模式挖掘方法，其特征在于，所述双通道自动编码层采用单层全连接神经网络作为自动编码器，该自动编码层包括两个通道，其中通道一用于对节点的出边Out向量编码，通道二用于对节点的入边In向量编码，所述出边Out向量和入边In向量编码后的结果分别记为Out
′
与In
′
，将节点i的Out
′
与In
′
按行拼接为新向量Vec
′
i
即可输入下一层，且该自动编码器的自动编码过程包括：步骤1：针对每一个节点Node，将输入向量设为其中对应Out向量的第i位编码位，对应边类型为R
i
，且将每个节点当做一个样本；步骤2：利用所述单层全连接神经网络中的隐藏层将输出向量进行非线性变换，最终还原成N维解码向量步骤3：采用梯度下降法对所述单层全连接神经网络进行训练，使用ReLU函数作为激活函数，使用最小均方误差作为损失函数，当与之间的差距最小时，得到中间权重步骤4：将各节点Node再次依次输入编码端，经隐藏层处理后得到K(K≤N)维隐层输出其中即为某个节点特征筛选以及降维后的结果...

【专利技术属性】
技术研发人员：段立，封皓君，王晶，薛杰，
申请(专利权)人：中国人民解放军海军工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人