【技术实现步骤摘要】
一种融合上下文语义的知识图谱链路预测模型、方法及装置
[0001]本专利技术涉及知识图谱链路预测
,具体为一种融合上下文语义的知识图谱链路预测模型、方法及装置。
技术介绍
[0002]致力于知识图谱链路预测领域的三元组语义信息的表示,考虑到现存知识图谱链路预测方法对于知识图谱内语境信息的建模不充分的弊端,加之研究者使用图嵌入方法增强实体和关系的语义化向量表示泛化能力差,以及融合外部文本知识编码方法缺乏结构化知识表示且计算开销过大的问题,在2018年TimDettmers提出的ConvE模型基础上使用循环神经网络模型捕获知识图谱内实体间的语义关系,提出一种结构增强的循环神经知识图谱链路预测方法,实现循环神经网络技术与知识图谱两大类方法的优势互补,提升知识图谱中实体和关系的语义表示能力,进一步优化知识图谱的链路预测任务。具体地将成熟的循环神经网络方法应用至知识图谱实体和关系的嵌入表示学习之中,进一步提高了知识图谱链路预测的性能。实验结果显示,我们的方法能够有效提高知识图谱链路预测的性能、速度和泛化能力。
[0003 ...
【技术保护点】
【技术特征摘要】
1.一种融合上下文语义的知识图谱链路预测模型,其特征在于,包括输入采样子图在输入中每个训练数据都是由n个实体构成的r
‑
子图谱,n指代r
‑
子图谱中的实体个数,根据广度优先搜索这一采样策略可生成一系列的关系序列,即一个r
‑
子图谱即为一条含有n个实体的关系路径,该子图谱可包含三个方面的语义信息:在知识图谱之中的结构信息、子图谱的类型属性元信息和本体信息(详细内容写于属性信息提取部分)以及实体和关系所蕴含的上下文自然语义知识信息,其中,特征提取层设计为一个接受m个维数为n
×
n的邻接矩阵和m个n
×
f的属性矩阵,这两个矩阵分别表示r
‑
子图谱的结构信息和子图谱的类型属性信息,这里m是指批量尺寸的大小;把m个p
×
q大小的知识图谱三元组数据输入进长短期记忆网络(LSTM),这里的p指的是知识图谱训练集的实体的个数(entity_num),q指的是每个实体的初始嵌入维度(embedding_dim);特征提取器层在本发明中特征提取器使用GCN(图卷积神经网络)提取知识图谱中实体节点的隐式特征信,针对所给定的某一实体节点,特征提取器层的GCN捕获基于此实体对象的知识图谱特征映射,本发明所提出的融合上下文语义信息的知识图谱链路预测模型中在捕获实体对象的隐式特征时,使用的是3个GCN相级联拼接,每个GCN网络的输入有两个部分:实体对象子图的结构信息和实体对象子图元信息和实体属性信息,其中,实体对象子图的结构信息是由实体对象子图的邻接矩阵计算得来的;给定实体对象子图的邻接矩阵A及元信息和实体属性信息H,GCN将二者表示为与正规化的图Laplaican联系紧密的静态特征矩阵:这里的A是知识图谱G的邻接矩阵,I是维数与A相同的单位矩阵,表示一个由矩阵每行数值之和计算得到的对角矩阵;计算得到矩阵A(G)后,将该矩阵和实体元信息
‑
属性矩阵H一起作为每个特征提取器GCN的输入;在此处可以发现特征提取器用于提取知识图谱的结构和上下文语...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。