【技术实现步骤摘要】
一种基于最小属性割的分布式SPARQL查询优化方法
[0001]本专利技术涉及分布式系统领域,更为具体地讲,涉及到分布式RDF系统的数据划分和查询处理。
技术介绍
[0002]RDF(Resource Description Framework)是一种由W3C组织提出的数据模型,其用三元组<主语,谓语,宾语>的基本形式表示web资源的属性、关系,目前在知识图谱、社交网络分析等领域均有应用。RDF数据模型表示形式灵活,不仅可以表示成关系数据库中的表,也可以表示成图模型。当RDF表示成图时,一个三元组代表着一条由主体指向客体的有向边及其连接的两个顶点,主体、客体是边的两个顶点,谓语则是有向边上的标签。W3C在提出RDF的同时,也提出了一种标准查询语言SPARQL(simple protocol and RDFquery language)。SPARQL与RDF一样,也能表示成图模型。查询图中的边称为三元组模式,三元组模式中的主语、谓语、宾语均可以是变量或常量。因为SPARQL与RDF都可以表示成图模型 ...
【技术保护点】
【技术特征摘要】
1.一种基于最小属性割的分布式SPARQL查询优化方法,其特征在于,包含如下步骤:(1)读取原始RDF数据图,保存边属性集合L;(2)计算每个边属性的弱连通分量及相应的代价;(3)尽可能多地选择内部属性,得到数据图的粗化图;(4)对粗化图进行顶点划分,并且反粗化处理,得到最终分区;(5)将SPARQL查询分解成一组可独立执行的子查询;(6)各个分区内并行执行分解后的子查询,获得匹配结果。2.根据权利要求1所述的基于最小属性割的分布式SPARQL查询优化方法,其特征在于,步骤2在计算弱连通分量时,为了便于在选择内部属性时对属性进行度量,会将弱连通分量的大小作为属性的代价。3.根据权利要求1所述的基于最小属性割的分布式SPARQL查询优化方法,其特征在于,步骤3在处理静态图数据时,边属性的数量是固定不变的,且类型只有内部属性、跨越属性两种;通...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。