The invention discloses a unified storage method of RDF graph and attribute graph based on relation model. According to the definition, characteristics and storage concept of relation table of two data models RDF graph model and attribute graph model of knowledge graph, two logical models RDF graph and attribute graph are stored in the physical model of relation table at the bottom layer, including the bottom layer storage of RDF graph and attribute graph. The semantic information of RDF graph and attribute graph is stored in the form of relational table at the bottom. For RDF three hypergraph structure, a system table is maintained to manage the edge points of some edges in RDF graph. The invention can solve the problem of the difference of semantic expression ability between RDF graph and attribute graph, realize large-scale storage and management of knowledge graph data, effectively reduce the redundancy of data, realize efficient query, and have strong application value.
【技术实现步骤摘要】
一种基于关系模型的RDF图和属性图统一存储方法
本专利技术涉及知识图谱领域,RDF存储与和属性图存储。
技术介绍
知识图谱作为符号主义发展的最新成果,是人工智能的重要基石。各领域中大规模知识图谱的构建和发布对知识图的数据管理提出了新的挑战。知识图数据模型基于图结构,用顶点表示实体、边表示实体之间的关系,这种通用的数据表示可以自然地描述现实世界中事物之间的广泛联系。目前,知识图谱有两种主流数据模型,即RDF(ResourceDescriptionFramework,资源描述框架)模型和属性图模型。前者已由W3C(WorldWideWebConsortium)标准化,后者已广泛用于图形数据库。RDF图模型具有较强的逻辑理论背景和较完善的数据模型特征。与RDF模型类似,属性图模型内置了对结点和边的属性的支持。虽然属性图还没有标准化,但是随着图数据库的应用,属性图在工业界中已经得到了广泛的认可。RDF图的超图结构证明了RDF图模型比属性图模型具有更强的表达能力,但至今依然没有一个统一的存储方案来有效地对知识图谱进行存储和管理。经过几十年的发展,关系模型已经具有了很高的成熟度。关系数据模型(relationaldatamodel)具有简洁而通用的关系结构,并且使用具有严格数学定义的关系代数表达式来表示关系上的操作和约束。因此,这为使用关系数据模型来统一存储RDF和属性图提供了坚实的理论基础。1.现有的RDF图存储方案:现有的RDF图数据典型的管理方案主要有两种:即基于关系的方法和基于图的方法。基 ...
【技术保护点】
1.一种基于关系模型的RDF图和属性图统一存储方法,其特征在于,将RDF图和属性图两种逻辑模型在底层以关系表的物理模型存储,包括RDF图的底层存储和属性图的底层存储。/n
【技术特征摘要】
1.一种基于关系模型的RDF图和属性图统一存储方法,其特征在于,将RDF图和属性图两种逻辑模型在底层以关系表的物理模型存储,包括RDF图的底层存储和属性图的底层存储。
2.根据权利要求1所述基于关系模型的RDF图和属性图统一存储方法,其特征在于,所述RDF图的底层存储,包括对于RDF图中点的转换、对于RDF图中边的转换和对于RDF中的具体化技术的转换;
对于RDF图中点的转换,步骤如下:
1-1)读入RDF三元组;若为<U1><rdf:type><U2>形式的RDF三元组,执行1-2),若为<U1><U2><L>形式的RDF三元组,且U1为结点类型关系表中的元组,执行1-4);
1-2)检查是否已经创建记录结点类型U2的关系表,若已创建结点类型U2的关系表,执行1-3);若未创建,则先创建结点类型U2的关系表,该关系表具有两列属性:id、properties;
1-3)为结点U1设置一个id值,将U1作为一个元组插入结点关系表U2中,执行1-1)循环读入RDF三元组;
1-4)将{U2:L}添加到U1元组的properties属性中,执行1-1)循环读入RDF三元组;
对于RDF图中边的转换,步骤如下:
2-1)读入RDF三元组;若为<U1><U2><U3>形式的RDF三元组,执行2-2);若为<U1><U2><L>形式的RDF三元组,且U1为边类型关系表中元组,执行2-4);
2-2)检查是否已经创建了记录边类型为U2的关系表;若已创建边结点类型U2的关系表,执行2-3);若未创建,则先创建边类型U2的关系表,该关系表具有四列属性:id、start、end、properties;
2-3)为该关系设置一个id值,将结点U1的id赋给start,将结点U3的id赋给end,将该元组插入边类型U2的关系表;执行2-1)循环读入RDF三元组;
2-4)将{U2:L}添加到U1元组的properties属性中,执行2-1)循环读入RDF三元组;
对于RDF中的具体化技术的转换,步骤如下:
3-1)读入<U1><U2><U3>三元组,U1为边类型关系表中的元组;检查是否已经创建了记录边类型为U2的关系表;若已创建边结点类型U2的关系表,直接执行3-2);若...
【专利技术属性】
技术研发人员:王鑫,柳鹏凯,张然,郭谢帆,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。