一种基于知识图谱叠加时空属性的MDATA知识表示方法技术

技术编号:37502230 阅读:17 留言:0更新日期:2023-05-07 09:38
公开了一种基于知识图谱叠加时空属性的MDATA知识表示方法,其将所有实体划分为主要实体和次要实体,将无实际含义的次要实体不参与表示计算,降低模型的计算开销;同时将时空属性融入关系和实体属性中,实现时空属性动态知识的有效表示;最后通过多级图架构隔离子图,实现子图间独立更新互不影响,满足动态知识的快速更新,也实现根据搜索目标选定不同层次的子图进行搜索,提高搜索速度,保证模型的可计算性和可实现性。可计算性和可实现性。可计算性和可实现性。

【技术实现步骤摘要】
一种基于知识图谱叠加时空属性的MDATA知识表示方法


[0001]本申请涉及知识表示
,且更为具体地,涉及一种基于知识图谱叠加时空属性的MDATA知识表示方法。

技术介绍

[0002]大数据时代,网络空间中的数据体量大、来源广泛、更新速度快,为了解决互联网空间中信息过载的问题,帮助用户在海量数据中及时准确地找到最需要的信息,众多研究者提出使用知识表示模型,实现知识综合和智慧解答。知识表示是对知识的一种描述,一种可以让计算机接受的用于描述知识的数据结构,知识表示可以将知识客体中的知识因子和知识关联起来,便于人们识别和理解知识。
[0003]自1960年以来,知识表示方法经历了一系列的过程演变。基于语义网络的知识表示方法提出用节点表示对象,边表示对象之间的联系,该表示方法易于理解且符合人类认知,但是没有逻辑基础导致表示不严格。基于逻辑规则的知识表示方法以数理逻辑为基础,使用精确性的语言和规则表达人类的思维和推理,但是也受限于规则,该表示方法无法表示非确定性知识、过程性知识和启发式知识,并且该方法推理效率低,时间长。
[0004]知识图谱是目前最常用且较为高效的知识表示方法,知识图谱通过将知识映射到一个低维连续空间内,实现信息的快速搜索和计算,并且可以将多种知识融合在一起。知识图谱中最经典的transe方法(Translating Embeddings for Modeling Multi

relational Data)将知识映射到一个低维空间内,使用嵌入向量表示所有的实体和边,后续研究者从不同角度将transe方法扩展为transh(KnowledgeGraph Embedding by Translating on Hyperplanes),rotate(Rotate: Knowledge Graph Embedding by Relational Rotation in Complex Space)等等。因为知识会随着时间发生演变,所以有研究者将时序信息融入到知识图谱中,比如ttranse(Deriving Validity Time in Knowledge Graph)就将知识三元组扩展为知识四元组(携带时间属性);同时还有研究者将其他信息融合到知识图谱中,比如专利“一种融合地理知识的混合知识图谱构建方法”将空间信息融入知识图谱中,专利“一种基于语义向量的知识图谱表示学习方法”将语义信息融入到知识图谱中,专利“基于多步关系路径的知识图谱表示学习方法”将路径关系融入到知识图谱中。
[0005]现有技术的缺点:上述三类知识图谱表示方法在不同方面都存在缺陷。
[0006]第一类知识图谱表示方法仅用来表示静态的知识,无法适用于演化的知识表示,也就是无法表示动态知识。
[0007]第二类知识图谱表示方法虽然考虑时序信息,并且将时序信息融合到知识图谱中变成一个时序知识图谱(感知时间),但是知识的演化还常常伴随着空间的变化,时序知识图谱并不能表示空间信息。
[0008]第三类知识图谱表示方法利用了关系路径、语境语义、地理信息等外部信息,虽然,某些知识图谱利用了空间信息,但却只是形成一个地理知识图谱,并不是将空间信息融合到知识图谱中。
[0009]所以,目前并没有一种知识图谱的知识表示方法可以同时表示知识中的时间信息和空间信息,已有方法也无法对动态知识进行快速更新。

技术实现思路

[0010]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于知识图谱叠加时空属性的MDATA知识表示方法,其将所有实体划分为主要实体和次要实体,将无实际含义的次要实体不参与表示计算,降低模型的计算开销;同时将时空属性融入关系和实体属性中,实现时空属性动态知识的有效表示;最后通过多级图架构隔离子图,实现子图间独立更新互不影响,满足动态知识的快速更新,也实现根据搜索目标选定不同层次的子图进行搜索,提高搜索速度,保证模型的可计算性和可实现性。
[0011]根据本申请的一个方面,提供了一种基于知识图谱叠加时空属性的MDATA知识表示方法,其包括:将概念实体划分为主要实体和次要实体;定义所述主要实体和次要实体之间的关系和属性,其中,所述关系用于描述主要实体与主要实体之间的关系,所述属性用于表示主要实体和次要实体之间的关系;以及在所述关系中引入时间信息和空间信息,以及,在所述属性中引入时间信息和空间信息。
[0012]在上述基于知识图谱叠加时空属性的MDATA知识表示方法中,所述将概念实体划分为主要实体和次要实体,包括:获取待划分的多个概念实体;将所述待划分的多个概念实体分别通过词嵌入层以得到多个概念实体嵌入向量;将所述多个概念实体嵌入向量通过基于转换器的上下文编码器以得到多个上下文概念实体语义特征向量;将所述多个上下文概念实体语义特征向量进行级联以得到概念实体全局语义特征向量;计算所述各个上下文概念实体语义特征向量相对于所述概念实体全局语义特征向量的转移矩阵以得到多个转移矩阵;以及,将所述多个转移矩阵分别通过分类器以得到分类结果,所述分类结果为概念实体的类型标签,所述类型标签为主要实体和次要实体。
[0013]在上述基于知识图谱叠加时空属性的MDATA知识表示方法中,所述将所述多个概念实体嵌入向量通过基于转换器的上下文编码器以得到多个上下文概念实体语义特征向量,包括:将所述多个概念实体嵌入向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个概念实体嵌入向量中各个概念实体嵌入向量作为值向量分别进行相乘以得到所述多个上下文概念实体语义特征向量。
[0014]在上述基于知识图谱叠加时空属性的MDATA知识表示方法中,所述将所述多个上下文概念实体语义特征向量进行级联以得到概念实体全局语义特征向量,包括:对所述各个上下文概念实体语义特征向量进行向量间聚合度优化以得到多个优化后上下文概念实体语义特征向量;以及,将所述多个优化后上下文概念实体语义特征向量进行级联以得到所述概念实体全局语义特征向量。
[0015]在上述基于知识图谱叠加时空属性的MDATA知识表示方法中,所述对所述各个上下文概念实体语义特征向量进行向量间聚合度优化以得到多个优化后上下文概念实体语义特征向量,包括:以如下公式对所述各个上下文概念实体语义特征向量进行向量间聚合
度优化以得到多个优化后上下文概念实体语义特征向量;其中,所述公式为: ,其中,是所述各个上下文概念实体语义特征向量,是所述多个上下文概念实体语义特征向量中与所述上下文概念实体语义特征向量之间的距离,也就是,小于预定阈值(例如,阈值记为)的上下文概念实体语义特征向量,为加权超参数,表示按位置作差,表示向量的指数运算,所述向量的指数运算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱叠加时空属性的MDATA知识表示方法,其特征在于,包括:将概念实体划分为主要实体和次要实体;定义所述主要实体和次要实体之间的关系和属性,其中,所述关系用于描述主要实体与主要实体之间的关系,所述属性用于表示主要实体和次要实体之间的关系;以及在所述关系中引入时间信息和空间信息,以及,在所述属性中引入时间信息和空间信息。2.根据权利要求1所述的基于知识图谱叠加时空属性的MDATA知识表示方法,其特征在于,所述将概念实体划分为主要实体和次要实体,包括:获取待划分的多个概念实体;将所述待划分的多个概念实体分别通过词嵌入层以得到多个概念实体嵌入向量;将所述多个概念实体嵌入向量通过基于转换器的上下文编码器以得到多个上下文概念实体语义特征向量;将所述多个上下文概念实体语义特征向量进行级联以得到概念实体全局语义特征向量;计算各个上下文概念实体语义特征向量相对于所述概念实体全局语义特征向量的转移矩阵以得到多个转移矩阵;以及将所述多个转移矩阵分别通过分类器以得到分类结果,所述分类结果为概念实体的类型标签,所述类型标签为主要实体和次要实体。3.根据权利要求2所述的基于知识图谱叠加时空属性的MDATA知识表示方法,其特征在于,所述将所述多个概念实体嵌入向量通过基于转换器的上下文编码器以得到多个上下文概念实体语义特征向量,包括:将所述多个概念实体嵌入向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述多个概念实体嵌入向量中各个概念实体嵌入向量作为值向量分别进行相乘以得到所述多个上下文概念实体语义特征向量。4.根据权利要求3所述的基于知识图谱叠加时空属性的MDATA知识表示方法,其特征在于,所述将所述多个上下文概念实体语义特征向量进行级联以得到概念实体全局语义特征向量,包括:对所述各...

【专利技术属性】
技术研发人员:贾焰顾钊铨方滨兴谢禹舜高翠芸廖清张欢闫昊杜磊
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1