一种基于多层划分框架的RDF分布式存储方法技术

技术编号:20363276 阅读:39 留言:0更新日期:2019-02-16 16:42
本发明专利技术公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明专利技术提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

【技术实现步骤摘要】
一种基于多层划分框架的RDF分布式存储方法
本专利技术属于分布式存储领域,具体涉及一种基于多层划分框架的RDF分布式存储方法。
技术介绍
随着语义网的高速发展,RDF(ResourceDescriptionFramework)作为语义网的核心标准也呈现爆炸式的增长,对大规模RDF数据的存储和查询管理成为了当前研究的热点。传统基于单机的RDF存储和查询由于数据扩展性差等问题在面对超大规模的RDF数据时难以管理,所以基于分布式的RDF存储和查询成为了研究趋势,而如何更好地将RDF分割且进行分布式查询成为了在分布式系统上对RDF研究的重点。分布式系统和云计算平台因为存储空间大,可扩展性强等优势而在各个领域取得长足发展。而RDF数据集的日渐增长也使得对RDF的存储和查询的研究在近些年来越来越多地向基于分布式系统或者云计算平台发展。分布式系统存储RDF图数据主要涉及到在分布式环境下的布局形式,分割算法,冗余算法等诸多问题。现有的RDF分布式存储技术主要包括基于哈希的RDF分割方法,基于键值对的RDF分割方法,基于图模型的RDF分割方法和基于多层划分框架的RDF分割方法,其中当前最为流行的就是基本文档来自技高网...

【技术保护点】
1.一种基于多层划分框架的RDF分布式存储方法,其特征在于,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k‑way分割,具体步骤如下:Step1执行以下初始化操作:101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},

【技术特征摘要】
1.一种基于多层划分框架的RDF分布式存储方法,其特征在于,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k-way分割,具体步骤如下:Step1执行以下初始化操作:101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量;102)数据预处理:将RDF数据的N-Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备;Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5,当模块度的增值大于ε,进行移动顶点;Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:301)RDF图中存在大量的属性节点,其入度都为1,所以本文认为将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;Step4通过B_AP算法对RDF图进行k-way分割,实现分割的平衡性和最小边割的目标。2.根据权利要求1所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step2中所述的MMA算法描述如下:假设顶点v从c1移动c2到了,则对于c1和c2的模块度的变化如下:式中E(c1)和E(c2)表示粗糙子图c1和c2中的边数,而和表示粗糙子图中c1和c2顶点v的邻居顶点;所以,模块度增值ΔQ的计算公式如下:ΔQ=ΔQ1+ΔQ2(7)。3.根据权利要求2所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step3中所述的MSLM算法描述如下:对于RDF图运行MSLM算法后,计算模块度值变量ΔQ',假设计算社团c1的某个顶点vi进行移动,其模块度变化计算公式如下:式中,ωin(vi)表示由顶点vi入射社团c1的权重之和,∑tot表示入射社团c1的总权...

【专利技术属性】
技术研发人员:刘均王瑞杰晋毓泽张铎魏笔凡王萌姚思雨曾宏伟
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1