当前位置: 首页 > 专利查询>湖南大学专利>正文

分布式RDF数据查询方法、装置和计算机设备制造方法及图纸

技术编号:32972310 阅读:15 留言:0更新日期:2022-04-09 11:41
本申请涉及一种分布式RDF数据查询方法、装置和计算机设备。所述方法包括:获取RDF数据集和SPARQL查询语句,根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点,一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系,根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点,接收各子节点反馈的查询结果,并对查询结果进行交集操作,得到目标查询结果,查询结果由各子节点根据接收到的子查询语句在划分得到的RDF数据中查询得到。采用本方法能够提高数据查询的效率。率。率。

【技术实现步骤摘要】
分布式RDF数据查询方法、装置和计算机设备


[0001]本申请涉及图数据管理
,特别是涉及一种分布式RDF数据查询方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]RDF(Resource Description Framework),即资源管理框架,是W3C制定的,该文档定义了一个抽象语法(数据模型),用于链接所有基于RDF的语言和规范。在RDF数据管理受到广泛关注的同时,W3C定义的标准查询语言SPARQL的存在推动了专注于在大型RDF数据集上高效执行SPARQL查询的工作。随着RDF数据量的增长,索引和查询大型数据集的计算复杂性变得具有挑战性。因此对大规模RDF数据集上的SPARQL查询的优化研究显得意义非凡。
[0003]目前的SPARQL查询系统大多以分布式系统为主,分布式系统利用无共享计算集群,构建在分布式数据处理框架之上,或实现专有的分布式计算方法。将RDF图划分到多台机器以处理大数据集,并将查询执行并行化以减少运行时间。回答查询通常涉及处理每台机器的本地数据,并在多台机器之间需要进行数据交换。
[0004]然而,上述现有的分布式RDF数据查询处理系统在提高并行化以减少运行时间的同时,存在数据分区开销过大、负载平衡不均等问题,而这些问题直接影响了数据查询的效率,降低了数据查询效率。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高数据查询效率的分布式RDF数据查询方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种分布式RDF数据查询方法。所述方法包括:
[0007]获取RDF数据集和SPARQL查询语句;
[0008]根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点,一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;
[0009]根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;
[0010]接收各子节点反馈的查询结果,并对查询结果进行交集操作,得到目标查询结果。
[0011]在其中一个实施例中,根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点之前,还包括:
[0012]对RDF数据集进行编码处理,得到编码后的RDF数据集以及双向字典;
[0013]根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点包括:
[0014]根据已构建的一致性哈希环,将编码后的RDF数据集划分至对应的子节点。
[0015]在其中一个实施例中,根据映射关系和预设的查询数据处理优先级,将SPARQL查询语句中的子查询语句分别发送至对应的子节点之前,还包括:
[0016]根据双向字典,对SPARQL查询语句进行编码处理,得到编码后的SPARQL查询语句;
[0017]根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点包括:
[0018]根据映射关系,将编码后的SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点。
[0019]在其中一个实施例中,根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点包括:
[0020]对RDF数据集中各RDF数据的主题值进行哈希计算,得到主题值的哈希值;
[0021]查找一致性哈希环上与主题值的哈希值对应的虚拟节点位置;
[0022]将各RDF数据发送至与虚拟节点位置对应的子节点。
[0023]在其中一个实施例中,根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点包括:
[0024]根据预设的查询数据处理优先级,对SPARQL查询语句进行排序,得到排序后的SPARQL查询语句;
[0025]根据映射关系,将排序后的SPARQL查询语句发送至对应的子节点。
[0026]在其中一个实施例中,一致性哈希环基于以下方式构建:
[0027]为各子节点分配预设数量的虚拟节点;
[0028]使用哈希算法获取各虚拟节点的位置,得到一致性哈希环。
[0029]第二方面,本申请还提供了一种分布式RDF数据查询装置。所述装置包括:
[0030]数据获取模块,用于获取RDF数据集和SPARQL查询语句;
[0031]数据划分模块,用于根据已构建的一致性哈希环,将所述RDF数据集划分至对应的子节点,所述一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;
[0032]查询语句发送模块,用于根据所述映射关系,将所述SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;
[0033]查询结果处理模块,用于接收各子节点反馈的查询结果,并对所述查询结果进行交集操作,得到目标查询结果。
[0034]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0035]获取RDF数据集和SPARQL查询语句;
[0036]根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点,一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;
[0037]根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;
[0038]接收各子节点反馈的查询结果,并对查询结果进行交集操作,得到目标查询结果。
[0039]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0040]获取RDF数据集和SPARQL查询语句;
[0041]根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点,一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;
[0042]根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;
[0043]接收各子节点反馈的查询结果,并对查询结果进行交集操作,得到目标查询结果。
[0044]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0045]获取RDF数据集和SPARQL查询语句;
[0046]根据已构建的一致性哈希环,将RDF数据集划分至对应的子节点,一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;
[0047]根据映射关系,将SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式RDF数据查询方法,其特征在于,所述方法包括:获取RDF数据集和SPARQL查询语句;根据已构建的一致性哈希环,将所述RDF数据集划分至对应的子节点,所述一致性哈希环包括各RDF数据主题值的哈希值与各子节点的虚拟节点位置的映射关系;根据所述映射关系,将所述SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点;接收各子节点反馈的查询结果,并对所述查询结果进行交集操作,得到目标查询结果。2.根据权利要求1所述的分布式RDF数据查询方法,其特征在于,所述根据已构建的一致性哈希环,将所述RDF数据集划分至对应的子节点之前,还包括:对所述RDF数据集进行编码处理,得到编码后的RDF数据集以及双向字典;所述根据已构建的一致性哈希环,将所述RDF数据集划分至对应的子节点包括:根据已构建的一致性哈希环,将编码后的RDF数据集划分至对应的子节点。3.根据权利要求2所述的分布式RDF数据查询方法,其特征在于,所述根据所述映射关系和预设的查询数据处理优先级,将所述SPARQL查询语句中的子查询语句分别发送至对应的子节点之前,还包括:根据所述双向字典,对所述SPARQL查询语句进行编码处理,得到编码后的SPARQL查询语句;所述根据所述映射关系,将所述SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点包括:根据所述映射关系,将所述编码后的SPARQL查询语句中的子查询语句按照查询数据处理优先级分别发送至对应的子节点。4.根据权利要求1至3任意一项所述的分布式RDF数据查询方法,其特征在于,根据已构建的一致性哈希环,将所述RDF数据集划分至对应的子节点包括:对所述RDF数据集中各RDF数据的主题值进行哈希计算,得到主题值的哈希值;查找所述一致性哈希环上与所述主题值的哈希值对应的虚拟节点位置...

【专利技术属性】
技术研发人员:肖国庆岑楚璇李肯立陈玥丹李雪琪周旭刘楚波阳王东唐卓廖清
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1