一种基于图谱表示学习的知识表示学习方法技术

技术编号：22261300 阅读：30 留言：0更新日期：2019-10-10 14:17

本发明专利技术公开了一种基于图谱表示学习的知识表示学习方法，其包括以下步骤：S1、基于知识图谱三元组和谓词获取标准图；S2、根据标准图获取知识图谱实体与关系的向量表示；S3、将深度学习分类任务的标签作为目标实体，根据知识图谱实体与关系的向量表示，基于相似性度量计算目标实体间的相似度，得到目标实体的图关联矩阵。本方法结合了实体之间的关系本身包含的信息，并将推理规则融合进来，因此容纳了大量的关联信息，使得学习得到的表示质量更佳。

A Knowledge Representation Learning Method Based on Map Representation Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图谱表示学习的知识表示学习方法
本专利技术涉及知识图谱表示学习领域，具体涉及一种基于图谱表示学习的知识表示学习方法。
技术介绍
传统的知识图谱表示学习方法大多数都基于翻译模型，例如TransE模型将每个三元组实例中的关系看作从头实体到尾实体的翻译，通过数学形式上的约束来对实体和关系建模，将它们映射到相同的向量空间中，这类方法注重实体与实体之间通过关系进行转换的翻译过程，学习得到的表示保留的主要是存在直接关系的实体之间的联系，而没有直接关系的实体之间的语义关联信息丢失严重。后续有很多在此基础上的改进工作，例如将实体和关系映射到不同的空间、结合概念图挖掘语义关系等方法，这类知识图谱表示学习方法能够挖掘的关联关系受目标函数的限制，主要捕获的依然是实体之间的翻译关系，而实体本身的上下文语义关联信息通过这种方式仍然难以捕获。有些工作也尝试在知识图谱中采用图谱表示学习方法，但是这些工作忽略了实体之间的关系本身包含的信息，更没有考虑将推理规则(谓词)融合进来，因此丢失了大量的关联信息，导致学习得到的表示质量不佳。
技术实现思路
针对现有技术中的上述不足，本专利技术提供的一种基于图谱表示学习的知识表示学习方法解决了现有知识图谱表示学习方法质量差的问题。为了达到上述专利技术目的，本专利技术采用的技术方案为：提供一种基于图谱表示学习的知识表示学习方法，其包括以下步骤：S1、基于知识图谱三元组和谓词获取标准图；S2、根据标准图获取知识图谱实体与关系的向量表示；S3、将深度学习分类任务的标签作为目标实体，根据知识图谱实体与关系的向量表示，基于相似性度量计算目标实体间的相似度，...

【技术保护点】
1.一种基于图谱表示学习的知识表示学习方法，其特征在于，包括以下步骤：S1、基于知识图谱三元组和谓词获取标准图；S2、根据标准图获取知识图谱实体与关系的向量表示；S3、将深度学习分类任务的标签作为目标实体，根据知识图谱实体与关系的向量表示，基于相似性度量计算目标实体间的相似度，得到目标实体的图关联矩阵。

【技术特征摘要】
1.一种基于图谱表示学习的知识表示学习方法，其特征在于，包括以下步骤：S1、基于知识图谱三元组和谓词获取标准图；S2、根据标准图获取知识图谱实体与关系的向量表示；S3、将深度学习分类任务的标签作为目标实体，根据知识图谱实体与关系的向量表示，基于相似性度量计算目标实体间的相似度，得到目标实体的图关联矩阵。2.根据权利要求1所述的基于图谱表示学习的知识表示学习方法，其特征在于，所述步骤S1的具体方法包括以下子步骤：S1-1、获取知识图谱(H,R,T)和谓词集合U，将((Hi,Rp,Tj),Uf,(Hi,Rq,Tj))表示为实体(Hi,Rp,Tj)与实体(Hi,Rq,Tj)关系之间的推理过程，即推理规则；其中H为头实体集合，Hi∈H；R为尾实体集合，Rp∈R，Rq∈R；T为关系集合，Tj∈T；S1-2、根据公式V＝H∪T∪R∪U获取顶点集合V，将头实体、尾实体、关系和谓词均作为标签，按照顶点集合V中的位置统一编号得到标签编号查询表；S1-3、将用编号表示的三元组(IDH,IDR,IDT)拆分为二元组(IDH,IDR)和二元组(IDR,IDT)；其中IDH,IDR和IDT分别为头实体、尾实体和关系的编号；S1-4、对于存在推理规则的实体，根据其编号生成二元组(IDR,IDU)和二元组(IDU,IDR')；其中IDU为推理规则谓词的编号；IDR和IDR'分别为存在推理规则的两个实体的尾实体编号；S1-5、将得到的所有二元组作为标准图中顶点与顶点之间的关系，并将二元组构成的集合作为标准图的边集，得到标准图。3.根据权利要求2所述的基于图谱表示学习的知识表示学习方法，其特征在于，所述步骤S2的具体方法包括以下子步骤：S2-1、根据标准图构建邻接矩阵，并将邻接矩阵的每一行作为一个顶点的初始向量表示；S2-2、采用自编码器对顶点的初始向量表示进行重构得到顶点的低维向量表示，即知识图谱实体与关系的向量表示，并将所有顶点的低维向量表示组合成矩...

【专利技术属性】
技术研发人员：刘鑫宇，王庆先，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人