【技术实现步骤摘要】
基于图的高效SPARQL查询应答方法、装置和设备
本专利技术示例性实施例涉及数据处理
,尤其涉及一种基于图的高效SPARQL查询应答方法、装置和设备。
技术介绍
由于RDF数据的使用越来越多,有效地处理RDF数据集上的SPARQL查询已经成为一个重要的问题。在基于图的RDF数据管理方案中,SPARQL查询被转换成子图模式,并通过图匹配在RDF图上求值。然而,要回答SPARQL查询,需要处理RDF推理来对RDF数据中的隐式三元组进行建模,这在很大程度上被现有的基于图的解决方案所忽略。在基于图的解决方案中,SPARQL查询被转换成图模式P,然后在RDF图G上进行求值。查询求值过程通过将P中的变量与G的元素匹配来执行,这样返回的图就包含在G中(模式匹配)。基于图的解决方案的主要优势在于,RDFquery5在不丧失建模能力的情况下更易于表达,更重要的是,没有优化策略的图模式匹配能够执行甚至优于关系RDF查询引擎。随后,人们提出了一些新的基于图的系统。特别是,gStore使用精心设计的索引VS*-tree来处理RDF查询 ...
【技术保护点】
1.一种基于图的高效SPARQL查询应答方法,其特征在于,包括:/n将RDF数据集的三元组建模为有向标记图,对有向标记图的实体顶点进行分组和合并,形成多级抽象图,其中三元组中的对象和主体为所述有向标记图的实体顶点;/n构建辅助数据结构,结合所述有向标记图中连接同一类的实体顶点,构造抽象图作为索引,所述辅助数据结构包括有向标记图模式中语义包含关系的集合,所述有向标记图模式用于描述所述有向标记图的特征;/n通过访问抽象图进行查询,并给出应答结果。/n
【技术特征摘要】
1.一种基于图的高效SPARQL查询应答方法,其特征在于,包括:
将RDF数据集的三元组建模为有向标记图,对有向标记图的实体顶点进行分组和合并,形成多级抽象图,其中三元组中的对象和主体为所述有向标记图的实体顶点;
构建辅助数据结构,结合所述有向标记图中连接同一类的实体顶点,构造抽象图作为索引,所述辅助数据结构包括有向标记图模式中语义包含关系的集合,所述有向标记图模式用于描述所述有向标记图的特征;
通过访问抽象图进行查询,并给出应答结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述有向标记图中的实体顶点附近的邻居结构编码成一个比特串,并对候选顶点进行剪枝,进行多级修剪进行细化,以给出经过优化后的应答结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过按需饱和策略对所述应答结果是否完整进行检测,包括以下两个阶段:
对数据边所包含的子属性进行检查,以查看是否有任何子属性与查询边匹配;
对实体顶点是否与抽象图中的查询顶点类型匹配进行检查。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过邻域编码对每一查询边的边属性信息进行无效候选的剪除。
5.根据权利要求4所述的方法,其特征在于,所述邻域编码包括:
将所述每一实体顶点描述为一个bit串,以作为顶点签名;
通过Bloom过滤器将RDF图中的每个顶点的相邻边属性和相应的相邻顶点属性编码成bit串。
6.根据权利要求1所述的...
【专利技术属性】
技术研发人员:郭得科,罗来龙,王希,张千桢,郑龙,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。