一种图的拆分方法和装置制造方法及图纸

技术编号:30492521 阅读:15 留言:0更新日期:2021-10-27 22:21
本申请实施例提供了一种图的拆分方法和装置,所述方法包括:获取查询图;所述查询图包括若干个节点以及若干连接所述节点的边,所述节点具有至少一个实例数据;采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值;采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图。通过本申请实施例的图的拆分方法,采用所述边以及所述实例数据,确定所述节点的数据膨胀值,对所述节点在拼装过程中生成的数据量进行预估。并采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图,从而在数据子图的拼装过程中,可以将数据膨胀值较大的节点放置在较后的顺序进行拼装。减少处理每一所述查询子图的查询任务需要消耗的计算资源。算资源。算资源。

【技术实现步骤摘要】
一种图的拆分方法和装置


[0001]本申请涉及图的拆分
,特别是涉及一种图的拆分方法和一种图的拆分装置。

技术介绍

[0002]图可以是一种数据的表示方法,其可以用于表示数据之间的关系。在进行数据挖掘时,可以根据数据挖掘的需要,采用特定的查询图,在海量数据形成的数据图中,查找与查询图具有子图同构关系的数据子图,以实现海量数据中挖掘特定的数据。然而,在海量数据中查找与查询图具有子图同构关系的数据子图,属于NP完全问题,需要消耗大量的计算资源进行处理。

技术实现思路

[0003]鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种图的拆分方法和相应的一种图的拆分装置。
[0004]为了解决上述问题,本申请实施例公开了一种图的拆分方法,包括:
[0005]获取查询图;所述查询图包括若干个节点以及若干连接所述节点的边,所述节点具有至少一个实例数据;
[0006]采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值;
[0007]采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图。
[0008]可选地,所述采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值的步骤,包括:
[0009]在所述边中,确定所述节点中每一所述实例数据对应的邻接边;
[0010]采用所述实例数据以及所述实例数据对应的邻接边,确定查询图中所述节点的数据膨胀值。
[0011]可选地,所述采用所述边,确定所述节点中每一所述实例数据对应的邻接边的步骤,包括:
[0012]在所述节点中,查找非叶子节点;
[0013]在所述边中,确定所述非叶子节点中每一所述实例数据对应的邻接边。
[0014]可选地,所述采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图的步骤,包括:
[0015]采用所述数据膨胀值,确定中心节点;
[0016]在所述查询图中,将所述中心节点以及所述中心节点的邻接节点拆分为查询子图。
[0017]本申请实施例还公开一种图的拆分装置,包括:
[0018]获取模块,用于获取查询图;所述查询图包括若干个节点以及若干连接所述节点的边,所述节点具有至少一个实例数据;
[0019]确定模块,用于采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值;
[0020]拆分模块,用于采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图。
[0021]可选地,所述确定模块包括:
[0022]邻接边确定子模块,用于在所述边中,确定所述节点中每一所述实例数据对应的邻接边;
[0023]膨胀确定子模块,用于采用所述实例数据以及所述实例数据对应的邻接边,确定查询图中所述节点的数据膨胀值。
[0024]可选地,所述邻接边确定子模块包括:
[0025]查找单元,用于在所述节点中,查找非叶子节点;
[0026]邻接边确定单元,用于在所述边中,确定所述非叶子节点中每一所述实例数据对应的邻接边。
[0027]可选地,所述拆分模块包括:
[0028]中心节点确定子模块,用于采用所述数据膨胀值,确定中心节点;
[0029]拆分子模块,用于在所述查询图中,将所述中心节点以及所述中心节点的邻接节点拆分为查询子图。
[0030]本申请实施例还公开一种装置,包括:
[0031]一个或多个处理器;和
[0032]其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如本申请实施例所述的一个或多个的方法。
[0033]本申请实施例还公开一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本申请实施例所述的一个或多个的方法。
[0034]本申请实施例包括以下优点:
[0035]通过本申请实施例的图的拆分方法,采用所述边以及所述实例数据,确定所述节点的数据膨胀值,对所述节点在拼装过程中生成的数据量进行预估。并采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图,从而在数据子图的拼装过程中,可以将数据膨胀值较大的节点放置在较后的顺序进行拼装。减少处理每一所述查询子图的查询任务需要消耗的计算资源,提高采用查询图查询数据图的查询效率。
附图说明
[0036]图1是本申请实施例的一种图的拆分方法实施例的步骤流程图;
[0037]图2是本申请实施例的另一种图的拆分方法实施例的步骤流程图;
[0038]图3是本申请实施例的一种查询图的示意图;
[0039]图4是本申请实施例的一种查询子图的示意图;
[0040]图5是本申请实施例的一种图的拆分装置实施例的结构框图。
具体实施方式
[0041]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
[0042]在本申请实施例中,可以以数据图形式的数据结构存储海量数据。在需要从海量数据中提取目标数据的情况下,可以采用查询图,通过子图匹配、模式匹配、基于关系网络的规则匹配等方式,在海量数据中提取得到目标数据。
[0043]例如,在银行客户担保关系分析,非法集资,洗钱行为等异常行为分析等特定对象社会关系分析、特定对象行为分析的情况下,可以通过查询图,在海量数据中提取得到具有特定社会关系或者具有特定行为的对象。又例如,在知识图谱中搜索内容的情况下,可以基于提出的问题生成查询图,在知识图谱中查询得到问题对应的答案。又例如,在商品推荐的情况下,可以通过查询图,在海量数据中提取得到具有相似特征的对象群体,并基于具有相似特征的对象群体的兴趣偏好推荐相应的商品。
[0044]在本申请实施例中,所述海量数据可以根据实际需要,存储于本地服务器,或者分布式部署的云服务器中。所述海量数据可以根据实际需要,从商业数据、互联网数据、传感器数据等来源获取得到。
[0045]所述海量数据可以采用数据图形式的数据结构存储。在以数据图形式存储海量数据的情况下,所述海量数据可以具有节点、以及连接所述节点的边。所述节点可以包括一种分类的数据记录。所述边可以用于表示所述节点的实例数据之间的关联关系。
[0046]在需要在海量数据中查询目标数据的情况下,可以基于检索输入的查询语句,生成具有特定数据结构的查询图,并采用所述查询图,遍历所述海量数据,查询得到与所述查询图具有子图同构关系的目标数据。
[0047]由于在查询图规模较大的情况下,直接在海量数据中查询与所述查询图具有子图同构关系的目标数据难度较大,为了提高查询效率,可以将查询所述海量数据使用的查询图,拆分为若干个查询子图,将所述查询子图与数据图形式的海量数据进行匹配,在海量数据中提取得到若干与所述查询子图形成子图同构关系的数据子图,将所述数据子图进行合并(join)操作,将若干数据子图中的数据相互连接,得到与所述查询图形成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图的拆分方法,其特征在于,包括:获取查询图;所述查询图包括若干个节点以及若干连接所述节点的边,所述节点具有至少一个实例数据;采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值;采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图。2.根据权利要求1所述的方法,其特征在于,所述采用所述边以及所述实例数据,确定查询图中所述节点的数据膨胀值的步骤,包括:在所述边中,确定所述节点中每一所述实例数据对应的邻接边;采用所述实例数据以及所述实例数据对应的邻接边,确定查询图中所述节点的数据膨胀值。3.根据权利要求2所述的方法,其特征在于,所述采用所述边,确定所述节点中每一所述实例数据对应的邻接边的步骤,包括:在所述节点中,查找非叶子节点;在所述边中,确定所述非叶子节点中每一所述实例数据对应的邻接边。4.根据权利要求1所述的方法,其特征在于,所述采用所述数据膨胀值,将所述查询图拆分为至少一个查询子图的步骤,包括:采用所述数据膨胀值,确定中心节点;在所述查询图中,将所述中心节点以及所述中心节点的邻接节点拆分为查询子图。5.一种图的拆分装置,其特征在于,包括:获取模块,用于获取查询图;所述查询图包括若干个节点以及若干连接所述节点的边,所述节点具有至少一个实例数据;确定模块,用于采用所述边...

【专利技术属性】
技术研发人员:李圣
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1