【技术实现步骤摘要】
一种分布式层次化的RDF数据的存储方法
本专利技术涉及通信
,尤其涉及一种分布式层次化的RDF (ResourceDescription Framework,资源描述框架)数据的存储方法。
技术介绍
语义网(Semantic Web)是万维网的一个重要发展方向,为万维网上的知识表示、推理、交换和复用提供了基础。由于任何机构和个人都允许自由发布语义网数据,尤其是现有商用搜索引擎倡导网站显式地提供语义数据、社交网络开始使用语义数据,这都使得语义网的数据量爆炸性增长。目前,以DBpedia和Bio2RDF为例的语义网数据已经达到了数以十亿计的规模。这些海量语义网数据一方面促进了语义网内容和知识的繁荣,同时也对现有语义网数据管理系统的性能提出了挑战。语义网数据是采用RDF模型来表示的。RDF是一种数据模型,它是一个W3C推荐标准,用于Web上的数据交换。RDF定义了一个简单的有向图模型来表示资源以及资源间的联系,每个联系表示为一个RDF三元组,包括主语、谓语和宾语三个部分。一个RDF三元组声明了该三元组中的主语和宾语存在的谓语联系是成立的。RDF可以很灵 ...
【技术保护点】
一种分布式层次化的RDF数据的存储方法,包括以下步骤:(1)对所有RDF数据进行索引;(2)采用两个存储层以存储索引后的RDF数据,从底层到上层依次为:持久化存储层和分布式内存存储层;所有RDF数据首先存储到持久化存储层,然后,将常用的RDF数据存储到分布式内存存储层;(3)将所有存储在持久化存储层的RDF数据自动保持多个备份;当检测到分布式内存存储层的节点发生数据失效后,在下次查询到该节点中的RDF数据时,从持久化存储层去获取相应的数据,然后根据一致性哈希算法将获取到的数据加载到分布式内存存储层的其他节点以供后面快速查询。
【技术特征摘要】
1.一种分布式层次化的RDF数据的存储方法,包括以下步骤: (1)对所有RDF数据进行索引; (2)采用两个存储层以存储索引后的RDF数据,从底层到上层依次为:持久化存储层和分布式内存存储层;所有RDF数据首先存储到持久化存储层,然后,将常用的RDF数据存储到分布式内存存储层; (3)将所有存储在持久化存储层的RDF数据自动保持多个备份;当检测到分布式内存存储层的节点发生数据失效后,在下次查询到该节点中的RDF数据时,从持久化存储层去获取相应的数据,然后根据一致性哈希算法将获取到的数据加载到分布式内存存储层的其他节点以供后面快速查询。2.根据权利要求1所述一种分布式层次化的RDF数据的存储方法,其特征在于:采用冷热数据混合索引的方法对所有RDF数据进行索引。3.根据权利要求1所述一种分布式层次化的RDF数据的存储方法,其特征在于:采用基于哈希的索引方法对所有RDF数据进行索引。4.根据权利要求3所述一种分布式层次化的RDF数据的存储方法,其特征在于:所述步骤(I)中,采用基于标准MD5哈希和闭散列的方法存储发生碰撞的RDF数据。5.根据权利要求1所述一种分布式层次化的RDF数据的存储方法,其特征在于:所述步骤(2)中,将“主语谓语*”和“*谓语宾语”这两种查询模式的RDF数据存储到分布式内存存储层,其中*为一个通配符,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。