一种基于规则嵌入表示的多空间语义数据流推理方法技术

技术编号:35849328 阅读:18 留言:0更新日期:2022-12-07 10:31
本发明专利技术提供一种基于规则嵌入和上下文感知的动态知识推理方法,首先实现规则与事实的联合嵌入表示,然后针对不同的语义数据流推理需求和场景实现设置不同的动态推理过程,包括基于平行语义空间推理的规则嵌入动态推理,基于上下文感知的规则嵌入动态推理和基于规则泛化学习的动态推理。本发明专利技术对融合了规则学习的联合嵌入模型做出改进以适应高速变化的语义数据流推理查询,该方案相比传统的流推理引擎可以在保证较高推理准确性的前提下提升复杂推理速度,其知识嵌入表示方法适用于1

【技术实现步骤摘要】
一种基于规则嵌入表示的多空间语义数据流推理方法


[0001][0002]本专利技术属于知识图谱和数据流处理领域,具体而言,是将知识表示学习方法用于动态知识推理任务中,实现在高速知识更新场景下的语义数据流推理技术。

技术介绍

[0003]随着移动互联网、大数据、物联网、社交网络等技术的发展,越来越多的需要对高速实时数据流进行分析和处理。传统的数据流处理手段主要根据数据流中的数据结构或者取值进行数据流的聚、分类研究
[1],无法在语义和知识层面上进行数据流的分析和推理。在知识图谱技术的支持下,可以利用资源描述框架(Resource Description Framework,RDF)将语义和知识赋予数据流,获得具有更好的可互操作性和可推理能力的语义数据流。语义数据流可以与静态的背景知识相结合来进行查询和推理,具有广泛的应用价值。
[0004]近年来知识推理领域取得了较多进展,但现有并行规则推理机制在应对大规模图谱时仍有不足
[2]。RDFox
[3]提出了一种高性能的知识图谱查询推理机制,并使用前后向结合的方式进行删除一致性检查。文献
[4]提出了基于单链推导(Single

way Derivability)优化的并行前向推理算法,并且性能优于RDFox。然而,以上知识推理研究主要针对静态数据,不适用于语义数据流。国内对于语义数据流的研究主要集中在窗口与查询优化
[5]、事件处理
[6]和聚类分析
[7],对语义数据流的实时推理的研究较少。现有的语义数据流推理方案主要基于确定性规则推导,不确定性知识推理的目前尚无法应用到语义数据流上。较早的不确定性统计推理主要使用马尔可夫逻辑网
[8]和概率软逻辑
[9]等手段,对本体频繁模式、约束和路径进行分析,从而得出推理结果,但这些方法仍然需要依赖实例化,因此可计算性较差
[10]。
[0005]2013年,在Mikolov等人提出了word2vec
[11]词表示学习模型之后,表示学习的方式在知识图谱领域受到广泛关注。随后Bordes等提出了TransE知识表示学习模型
[12]。该模型将三元组中的关系看作平移向量,表示头实体与尾实体之间的平移。因为TransE模型的参数简单,计算复杂度低,出现了大量基于TransE模型改进和补充的知识表示学习模型,如TransH
[13]、 TransR
[14]和TranSpare
[15]等。虽然以上模型都对TransE模型做了相应的改进,但是都是基于事实三元组的向量化而没有利用规则,因此KALE
[16]在TransE模型的基础上建立了三元组与规则的统一表示框架。然而KALE无法进行增量更新。此外,KALE也无法进行对规则本身的学习和泛化,来满足弱规则约束下的推理需求。
[0006]动态图嵌入(Dynamic Graph Embedding)方法在知识表示学习的基础上研究对动态变化的图进行推理。动态嵌入方法通过在代价函数中引入时间正则化
[17]或加入基于时间层的注意力机制
[18]等方法来捕捉图的变化特征,往往运用在新闻事件、社交网络或无线网络分析领域。但这种方法仍需要进行全量训练,因此主要研究提高对于低速变化(更新时间以数日到数年计)图的预测准确性,而非及时性。通过对学习率的动态调整可以缩短训练时间
[19],这种方法依赖于数据特性,因此可迁移性较差。
Sparse Transfer Matrix[C]//Thirtieth Aaai Conference on Artificial Intelligence.AAAI Press,2016.
[0023][16]Guo S,Wang Q,Wang L,et al.Jointly embedding knowledge graphs and logical rules[C]//Proceedings of the 2016Conference on Empirical Methods in Natural Language Processing,2016:192

202.
[0024][17]J
é
r
é
mie Rappaz,Dylan Bourgeois,and Karl Aberer.2019.A Dynamic Embedding Model of the Media Landscape.In The World Wide Web Conference(WWW

19).Association for Computing Machinery,New York,NY,USA,1544

1554.
[0025][18]Yang L.,Xiao Z.,Jiang W.,et al.(2020)Dynamic Heterogeneous Graph Embedding Using Hierarchical Attentions.In:Jose J.et al.(eds)Advances in Information Retrieval.ECIR 2020. Lecture Notes in Computer Science,vol 12036.Springer,Cham
[0026][19]Minervini P,Fanizzi N,D'Amato C,et al.Scalable Learning of Entity and Predicate Embeddings for Knowledge Graph Completion[C]//2015IEEE 14th International Conference on Machine Learning and Applications(ICMLA).IEEE,2015.

技术实现思路

[0027]针对现有的语义数据流推理方法的不足之处,本专利技术提出基于规则嵌入表示的多空间语义数据流推理方法。本专利技术的目的是在现有的语义数据流查询和推理的基础上提供准确性高、及时性好的不确定性知识推理方法,从而实现在高速更新的三元组数据流场景下的动态实时知识推理。
[0028]为了解决上述现有技术中存在的不足,本专利技术提出一种基于规则嵌入和上下文感知的动态知识推理方法,首先实现规则与事实的联合嵌入表示,然后针对不同的语义数据流推理需求和场景实现设置不同的动态推理过程,包括基于平行语义空间推理的规则嵌入动态推理,基于上下文感知的规则嵌入动态推理和基于规则泛化学习的动态推理;
[0029]所述基于平行语义空间推理的规则嵌入动态推理,是针对头尾实体比例为1:1的推理场景,结合语义数据流处理平台和知识表示学习进行处理,实现过程包括首先,对联合嵌入模型KALE扩展,实现复杂规则和事实元组的统一表示推理框架;然后实现嵌入空间的构建和选择;最后实现基于联合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于规则嵌入和上下文感知的动态知识推理方法,其特征在于:首先实现规则与事实的联合嵌入表示,然后针对不同的语义数据流推理需求和场景实现设置不同的动态推理过程,包括基于平行语义空间推理的规则嵌入动态推理,基于上下文感知的规则嵌入动态推理和基于规则泛化学习的动态推理;所述基于平行语义空间推理的规则嵌入动态推理,是针对头尾实体比例为1:1的推理场景,结合语义数据流处理平台和知识表示学习进行处理,实现过程包括首先,对联合嵌入模型KALE扩展,实现复杂规则和事实元组的统一表示推理框架;然后实现嵌入空间的构建和选择;最后实现基于联合嵌入模型的动态推理训练,并根据训练输出模型实现实时知识推理;所述基于上下文感知的规则嵌入动态推理,是针对头尾实体比例1对多或多对多的推理场景,进行基于上下文感知的多语义空间融合表示知识推理,实现过程包括首先,在多空间联合嵌入模型基础上扩展,实现上下文感知的动态推理框架;其次,对实体关系及其类型与规则关联上下文进行建模和表示;第三,进行上下文向量空间和规则嵌入空间的集成;最后,实现对增量更新和累计偏移感知的支持;所述基于规则泛化学习的动态推理,是针对弱规则约束或规则不全的推理场景,依据规则样例来进行规则学习,从而泛化规则并扩展推理结果,实现过程包括在知识表示学习的实时推理基础上进行规则泛化研究,并结合语义数据流处...

【专利技术属性】
技术研发人员:高峰曾燕顾进广刘茂福周杰王昆潘巧玲陆紫雯
申请(专利权)人:江苏有米云智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1