一种不确定图查询方法及装置制造方法及图纸

技术编号:12394720 阅读:62 留言:0更新日期:2015-11-26 01:50
本发明专利技术公开了一种不确定图查询方法及装置,用以实现不确定图的快速查询,降低查询复杂度,提高查询效率。该方法为:接收查询指令,所述查询指令用于从不确定图中查询符合查询条件的数据;根据查询指令确定所述不确定图中的两个顶点,并确定以所述两个顶点中的一个顶点为起点、另一个顶点为终点的所有可能的路径,计算每条所述路径所对应的第一事件或第二事件的概率;根据所述第一事件的概率或所述第二事件的概率,获得所述查询指令对应的查询结果。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种不确定图查询方法及装置
技术介绍
近年来,随着三网融合和网络新媒体等新技术的发展,有大量的图数据产生。图数 据有两个显著的特性:一是图的规模庞大,顶点规模在百万以上,例如Web信息、图结构的 可扩展标示语言(XML, Extensive Makeup Language)数据、社交网络;二是图结构的不确定 性,例如顶点之间的连接不确定。不确定性在图数据中普遍存在。例如,处于无线随意网 络中的个人移动设备,设备彼此之间的连接无固定的网络结构,并且因为移动设备电量等 因素的影响,两个设备间的连接并不随时可靠,而按照一定的概率存在。又例如,任意不同 类的蛋白质之间都可能有彼此相互作用而形成复杂的图数据,由于测量误差,实验观测到 的某两种蛋白质之间相互作用只是以一定概率真正存在。不确定图模型同以往的图数据模 型有着根本的差异,不确定图是以顶点和边为基本概率事件的概率事件组合,如图1所示。 目前,对于大规模图数据提出了许多具有高扩展性的查询算法和索引机制,但这 些查询算法和索引机制基本都是基于确定的图结构的,而不能直接应用到不确定图上。 一方面,图查询通常基于图的结构,基本的图查询大致可分为三类:(a)基于图中 路径的查询,比如,可达性查询,最短路径/距离查询等;(b)基于图中顶点的查询,比如最 近邻查询等;(c)基于子图的查询,比如子图匹配、频繁子图挖掘等。另一方面,在不确定数 据库中,每一个元组都标有一个概率表示该元组为真实的可能性或元组的属性被表示为一 个概率分布函数。不确定数据库提出了不确定数据的可能世界模型,通过不确定性数据查 询处理的核心"可能世界模型",不确定图能演化出诸多结构确定的图实例,这些结构确定 的图实例按相应的概率分布并且概率之和为1,如图2所τκ。 不确定图由大量的小图构成,每个小图的规模在百计或最多千计的顶点数或边 数。为了让不确定图查询具有通过可能世界实证的概率保证,这意味着需要在不确定图演 化出的指数级图实例上的图搜索,其开销是不能接受的,查询处理的代价非常高。 因此,如何实现不确定图的快速查询成为有待解决的技术问题。
技术实现思路
本专利技术提供一种不确定图查询方法及装置,用以实现不确定图的快速查询,降低 查询复杂度,提高查询效率。 本专利技术实施例提供的具体技术方案如下: 第一方面,本专利技术提供了一种不确定图查询方法,包括: 接收查询指令,所述查询指令用于从不确定图中查询符合查询条件的数据; 根据查询指令确定所述不确定图中的两个顶点,并确定以所述两个顶点中的一个 顶点为起点、另一个顶点为终点的所有可能的路径; 计算每条所述路径所对应的第一事件或第二事件的概率;其中,一条路径对应的 第一事件定义为该路径存在、且该路径对应的第一路径不存在、以及该路径对应第二路径 中的一个或多个不存在的事件;一条路径对应的第二事件定义为该路径存在、且该路径对 应的第一路径不存在的事件;一条路径对应的第一路径为包含边的个数小于该路径包含边 的个数的其它路径,一条路径对应的第二路径为包含边的个数等于该路径包含的边的个数 的其它路径; 根据所述第一事件的概率或所述第二事件的概率,获得所述查询指令对应的查询 结果。 结合第一方面,在第一种可能的实现方式中,所述计算每条所述路径所对应的第 一事件的概率,包括: 将确定的所述所有可能的路径按照所包含边的个数从少到多的顺序排序; 根据排序结果计算每条路径所对应的所述第一事件的概率,所述每条路径的第一 事件为该路径存在、且该路径对应的第三路径不存在的事件,该路径对应的第三路径为排 序结果中排在该路径之前的其它路径; 所述计算每条所述路径所对应的第二事件的概率,包括: 将确定的所述所有可能的路径按照所包含边的个数从少到多的顺序排序; 根据排序结果计算每条路径所对应的第二事件的概率,所述每条路径的第二事件 为该路径存在、该路径对应的第一路径不存在的事件,该路径对应的第一路径为排序结果 中排在该路径之前、且包含边的个数小于该路径包含边的个数的其它路径。 结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述查询 指令为最短距离查询指令,用于查询所述不确定图中以所述两个顶点中的一个顶点为起 点、另一个顶点为终点、且包含设定数目的边的个数的路径的概率分布; 所述根据所述第一事件的概率或所述第二事件的概率,获得所述查询指令对应的 查询结果,包括: 确定所述所有可能的路径中包含所述设定数目的边的个数的各路径,计算确定的 所述各路径中的每条路径所对应的所述第一事件的概率的和,将所述概率的和作为查询结 果。 结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,所述查询 指令为可达性查询指令,用于查询所述不确定图中以所述两个顶点中的一个顶点为起点、 另一个顶点为终点的路径存在的概率,所述根据所述第一事件的概率或所述第二事件的概 率,获得所述查询指令对应的查询结果,包括: 针对所述所有可能的路径中的每条路径,计算该路径以及排在该路径之前的其它 路径所对应的所述第一事件的概率的和,将所述概率的和作为查询结果。 结合第一方面的第一种可能的实现方式,在第四种可能的实现方式中,所述查询 指令为最短路径查询,用于查询所述不确定图中以所述两个顶点中的一个顶点为起点、另 一个顶点为终点、且包含的边的个数最少的路径的概率分布,所述根据所述第一事件的概 率或所述第二事件的概率,获得所述查询指令对应的查询结果,包括: 将所述所有可能的路径中的每条路径及所对应的第二事件的概率作为查询结果。 结合第一方面至第一方面的第四种可能的实现方式中的任意一种,在第五种可能 的实现方式中,所述计算每条所述路径所对应的第一事件或第二事件的概率,包括: 从所述不确定图中选择设定个数的边,确定选择的边对应的组合事件,所述组合 事件表示所选择的边中的一个或多个边存在或不存在的事件的组合,并计算所述选择的边 对应的各所述组合事件发生的概率的和作为第一累计和; 确定选择的所述设定个数的边构成一条路径,且所对应的组合事件符合所述第一 事件的定义时,计算符合所述第一事件的定义的所述组合事件发生的概率的和作为第二累 计和,或者,确定选择的所述设定个数的边构成一条路径,且所对应的组合事件符合所述第 二事件的定义时,计算符合所述第二事件的定义的所述组合事件发生的概率的和作为第三 累计和; 计算所述所有可能的路径中的每条路径存在的概率的和作为第四累计和,根据所 述第一累计和、第二累计和以及所述第四累计和,确定所述第一事件的概率;或者,根据所 述第一累计和、第三累计和以及所述第四累计和,确定所述第二事件的概率。 结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,根据所述 第一累计和、第二累计和以及所述第四累计和,确定所述第一事件的概率;或者,根据所述 第一累计和、第三累计和以及所述第四累计和,确定所述第二事件的概率,包括: 计算所述第二累计和与所述第一累计和的比值,并将该比值乘以所述第四累计和 后作为所述第一事件的概率; 或者, 计算所述第三累计和与所述第一累计和的比值,将该比值乘以所述第四累计和后 作为所述第二事件的概率。 第二方面,本专利技术提供了一种不确本文档来自技高网
...

【技术保护点】
一种不确定图查询方法,其特征在于,包括:接收查询指令,所述查询指令用于从不确定图中查询符合查询条件的数据;根据查询指令确定所述不确定图中的两个顶点,并确定以所述两个顶点中的一个顶点为起点、另一个顶点为终点的所有可能的路径;计算每条所述路径所对应的第一事件或第二事件的概率;其中,一条路径对应的第一事件定义为该路径存在、且该路径对应的第一路径不存在、以及该路径对应第二路径中的一个或多个不存在的事件;一条路径对应的第二事件定义为该路径存在、且该路径对应的第一路径不存在的事件;一条路径对应的第一路径为包含边的个数小于该路径包含边的个数的其它路径,一条路径对应的第二路径为包含边的个数等于该路径包含的边的个数的其它路径;根据所述第一事件的概率或所述第二事件的概率,获得所述查询指令对应的查询结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:成杰峰何诚范伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1