一种基于三元组的RDF数据管理方法、装置及存储介质制造方法及图纸

技术编号:21798999 阅读:41 留言:0更新日期:2019-08-07 10:28
本发明专利技术实施例公开了一种基于三元组的RDF数据管理方法、装置及存储介质,将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组,三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;将各三元组的三种类型的待存储三元组,分别存储于SSD上物理存储地址不同的存储单元中;将各待存储三元组的主键与待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。通过本发明专利技术的实施,将每个三元组数据按不同组织形式在SSD上存储三份,充分利用了SSD的高并行性,极大提高了在SSD上的数据管理性能。

A Triple-based RDF Data Management Method, Device and Storage Media

【技术实现步骤摘要】
一种基于三元组的RDF数据管理方法、装置及存储介质
本专利技术涉及数据管理领域,尤其涉及一种基于三元组的RDF数据管理方法、装置及存储介质。
技术介绍
大数据时代,信息呈现出高度非结构化和自由而丰富的关联性,许多知识库如微博、Facebook等的数据集通常以资源描述框架(RDF,ResourceDescriptionFramework)的形式进行存储。RDF数据实际上是由一些列的三元组数据组成的,其中每个三元组都是由三个元素组成:资源、属性和属性值,也称之为主语(Subject)、谓语(predicate)以及宾语(Object)。近些年随着RDF的普及,RDF数据的数量已经大大增加,在许多RDF数据集中(例如Wikipedia)产生了数十亿个三元组。因此,如何有效地管理这些庞大的RDF数据成为一个巨大的挑战。目前,通常是将RDF数据在固态硬盘(SSD,SolidStateDrive)进行存储,然而相关技术中在存储过程中,并未考虑到SSD内部的空间特性,例如channel,die,plane等内部信息,而是将RDF数据随机存储在SSD上的空闲存储单元,使得SSD的性能未得到充分发挥,本文档来自技高网...

【技术保护点】
1.一种基于三元组的RDF数据管理方法,其特征在于,包括:将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组;所述三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;将所述各三元组的所述三种类型的待存储三元组,分别存储于所述SSD上物理存储地址不同的存储单元中;将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。

【技术特征摘要】
1.一种基于三元组的RDF数据管理方法,其特征在于,包括:将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组;所述三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;将所述各三元组的所述三种类型的待存储三元组,分别存储于所述SSD上物理存储地址不同的存储单元中;将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。2.如权利要求1所述的基于三元组的RDF数据管理方法,其特征在于,在将所述各三元组的所述三种类型的待存储三元组,分别存储于所述SSD上物理存储地址不同的存储单元中之后,还包括:将存储于同一存储单元中类型相同的所有待存储三元组,按照预设的排序规则进行排序。3.如权利要求1所述的基于三元组的RDF数据管理方法,其特征在于,在将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表之后,还包括:在接收到RDF数据查询请求时,获取至少一个待查询三元组;所述待查询三元组中的已知元素为查询条件,所述待查询三元组中的未知元素为查询结果,所述已知元素至少包括所述待查询三元组的主键;基于所述主键在所述地址索引表查找对应于所述主键的物理存储地址;将对应于所述物理存储地址的存储单元所存储的所有三元组进行加载,并基于所述已知元素从所加载的三元组中查找所述未知元素,得到所述查询结果。4.如权利要求3所述的基于三元组的RDF数据管理方法,其特征在于,在对应于所述主键的物理存储地址有多个时,所述将对应于所述物理存储地址的存储单元所存储的所有三元组进行加载包括:将对应于各所述物理存储地址的多个存储单元所存储的所有三元组,并行地进行加载。5.如权利要求1所述的基于三元组的RDF数据管理方法,其特征在于,在将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表之后,还包括:在接收到RDF数据更新请求时,在所述SSD上新开辟一个存储单元;...

【专利技术属性】
技术研发人员:陈仁海燕国骅关启明冯志勇
申请(专利权)人:天津大学深圳研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1