System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于图形数据库Neo4j的模糊时空RDF存储管理方法技术_技高网

一种基于图形数据库Neo4j的模糊时空RDF存储管理方法技术

技术编号:40363811 阅读:10 留言:0更新日期:2024-02-09 14:51
本发明专利技术公开了一种基于图形数据库Neo4j的模糊时空RDF存储管理方法。本发明专利技术属于模糊时空知识图谱管理领域。本发明专利技术被运用到模糊时空RDF管理系统中,主要针对海量模糊时空RDF数据难以有效管理的问题。为解决该问题,系统首先对模糊时空RDF进行解析,获取模糊时空RDF的主语S、静态谓语Pso、宾语O、时空动作STM、动态谓语Pst、时空信息STl、时间T和空间L以及相应的隶属度;其次根据所提出的映射规则将解析得到的数据存入图数据库中;最后利用Cypher语句实现数据查询。本发明专利技术的主要用途是利用图数据库的图模式与模糊时空知识图谱的图模式的结构相似这一特点,实现模糊时空知识图谱的持久化管理。

【技术实现步骤摘要】

本专利技术公开了一种基于图数据库neo4j的模糊时空rdf存储管理方法。基于图数据库高性能、灵活的图形数据模型以及强大的查询能力等特点,利用图形数据库neo4j对携带模糊时空信息的rdf数据进行管理。本方法属于模糊时空知识图谱管理领域。


技术介绍

1、rdf是一种用于描述信息资源及其相互关系的模型,由于具有强大的语义表达能力,被广泛应用于知识图谱的构建过程中。经典的rdf模型能够有效的表示静态知识图谱。然而语义网中不只有静态数据,还存在着大量的时空信息,这些信息的出现通常还会伴随着不精确或不确定的模糊信息。因此,如何高效的表示和管理不确定的时空数据成为一个亟待解决的难题。

2、目前,针对时空特征的建模方法主要有两种:时空标签法和三元组扩展法。时空标签法在不改变三元组结构的情况下,在rdf三元组中添加时空标签。三元组扩展法则是通过在rdf中添加时间和空间元素,将三元组扩展为四元组或五元组。对于不确定性的表示,主要基于rdf模型的两级结构:三元组级和元素级来建立两级模糊扩展,从而描述多粒度模糊性。三元组层面的模糊rdf表示将rdf模型的每个三元组与表示不确定性度量的隶属度相关联。元素层面的模糊rdf有两种表示。第一种是为三元组的其中一个元素添加隶属度。第二种方法考虑到三元组的主语、谓语和宾语都可以具有不确定性,因此将三元组的每个元素作为一个模糊概念。为了更好的表示和应用模糊时空数据,已经有一些模糊时空rdf模型被提出。然而,这些模型只能表示部分元素的模糊性,忽略了时空信息本身的不确定性。此外,已有的模型是在特定研究下给出的,缺乏通用性。本专利技术提出的模糊时空rdf模型不局限于特定场景,采用三元组扩展法,隶属度被添加到主语、宾语、谓语和时空信息上,可以有效表示知识图谱的静态语义和时空语义。

3、关于经典rdf数据存储的研究已经相对成熟,但是如何存储模糊时空rdf数据仍然还未提及。总的来说,可将rdf存储方法分为三类,一是基于文件系统,如在xml/rdf格式的文件中存储rdf;二是基于内存的存储,由操作系统直接分配内存空间用来存储;三是基于数据库的存储。其中,基于文件系统的存储需要频繁的读写磁盘,影响存储的性能;基于内存的存储只适用于存储少量的数据;基于数据库系统的存储是应用最广泛的存储方式,在数据管理方面占据着非常重要的地位。因此,本专利技术考虑将模糊时空rdf存储到数据库中。

4、市场上主流的数据库类型有关系数据库、面向对象数据库、分布式数据库和图数据库等。基于以下原因,本专利技术考虑将模糊时空rdf存储到图数据库neo4j中。(1)本质上看,模糊时空rdf是图模型,其图形结构和属性图的图形结构类似。(2)属性图模型符合rdf模型的语义层次,能够最大限度的维护rdf数据的语义信息。(3)图模型中基于图论的算法可以优化rdf数据的查询性能。

5、本专利技术设计了一种基于三元组扩展的在元素层面添加隶属度的模糊时空rdf模型,并提出了一种基于图形数据库neo4j的模糊时空rdf持久化方法。方法首先对输入的turtle格式的模糊时空rdf数据进行解析,获取fstrdf的各个组成元素;然后进一步对获取到的字符串进行分割,获取各元素的隶属度。最后从以下四个方面考虑将获取到的各个元素存储到neo4j中,分别是:节点的映射、边的映射、节点类型的映射以及隶属度的映射。此外,本专利技术可通过查询模块,实现对数据库中的模糊时空rdf数据的查询。


技术实现思路

1、专利技术目的:本专利技术的目的是针对设计出的新的模糊时空rdf模型提供一种高效的模糊时空rdf数据的存储管理方法。

2、技术方案:本专利技术具体的技术方案包括以下内容:

3、(1)数据解析

4、为了更好的表示模糊时空知识图谱,本方法采用一种新的基于元素层面添加隶属度的模糊时空rdf模型,该模型通过绑定四个三元组来表示一个模糊时空rdf六元组。针对该模糊时空rdf数据。具体处理流程如下:

5、1>对三元组进行解析,获取主语、静态谓语、宾语、时空动作、时空谓语、时空信息、时间和空间。

6、2>对获取到的各元素进行分割,去除各元素的前缀。

7、3>对获取到的三元组进行二次分割,分割出各元素的隶属度。

8、(2)数据库结构设计

9、1>设计图数据库的静态存储结构,用于存储模糊静态rdf数据。

10、2>设计图数据库的动态存储结构,用于存储模糊时空rdf数据。

11、(3)数据映射

12、根据上述设计的新的模糊时空rdf模型和图形数据库的结构,结合模糊时空rdf数据的语义特点,本专利技术从以下四个方面来设计存储规则。

13、1>节点的映射:模糊时空rdf图中不同类型的节点被映射到属性图中的不同位置。

14、2>边的映射:主要讨论边的类型是时空边和普通边的情况。

15、3>节点类型的映射:根据节点类型是资源,字面量,空白节点设计不同的存储方法。

16、4>隶属度的映射:设计了模糊时空rdf图中边的隶属度和节点的隶属度的映射方法

本文档来自技高网...

【技术保护点】

1.一种基于图数据库Neo4j的模糊时空RDF存储管理方法,其主要特征包括以下步骤:

2.根据权利要求1所述的基于图数据库Neo4j的模糊时空RDF存储管理方法,其特征在于:

3.根据权利要求1所述的基于图数据库Neo4j的模糊时空RDF存储管理方法,其特征在于:

4.根据权利要求1所述的基于图数据库Neo4j的模糊时空RDF存储管理方法,其特征在于:

【技术特征摘要】

1.一种基于图数据库neo4j的模糊时空rdf存储管理方法,其主要特征包括以下步骤:

2.根据权利要求1所述的基于图数据库neo4j的模糊时空rdf存储管理方法,其特征在于:

<...

【专利技术属性】
技术研发人员:张超杰马宗民
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1