一种关系型地质数据库与NoSQL的融合方法及系统技术方案

技术编号:19745267 阅读:31 留言:0更新日期:2018-12-12 04:44
一种关系型地质数据库与NoSQL的融合方法与系统,包含结构获取步骤、数据存储步骤以及数据检索步骤。先获取设计好的非结构化数据的NoSQL存储结构,依据该存储结构设计关系型连接表;然后依据设计的非结构化数据的存储结构将非结构化数据存储至NoSQL,同时获取所述非结构化数据内部要素的索引信息,并把非结构化数据内部要素的索引信息存储至关系型连接表中;检索时采用SQL方式从关系型连接表中检索相应的非结构化数据的索引信息,依据索引信息获得非结构化数据的要素信息或对应的非结构化数据。本发明专利技术既发挥了NoSQL对非结构化数据灵活自由的管理功能,又利用了关系型数据库的强大检索功能,从而使既含有大量结构化数据,又含有大量非机构化数据的地质数据,管理更加方便、高效。

【技术实现步骤摘要】
一种关系型地质数据库与NoSQL的融合方法及系统
本专利技术属于大数据管理领域,尤其是数据库管理技术方面,更具体地说是涉及一种关系型地质数据库与NoSQL的融合方法及系统。
技术介绍
关系型数据库,是建立在关系模型基础上的数据库,是由多个具有一定关联关系的二维行列表组成的数据库。由于二维表结构的关系模型在逻辑上易于理解,具有坚实的数学基础,而且可以保持数据的一致性;通用的SQL语言使得关系型数据库的操作、维护和各类复杂查询的实现都非常方便;关系模型的SQL把计算机与人类认知很好地衔接起来,是一种方便的数据交互语言。因而,关系型数据库是目前数据管理的主流数据库,尤其是针对结构化数据,关系型数据库是结构化数据库的典型代表。但是,地质数据中含有大量的非结构化数据,如大量的地质报告、大量的地质图件等等,这些非结构化数据中往往含有十分丰富的数据和信息,而关系型数据库一般采用索引表或大字段存储的方式管理这些非结构化数据,这种管理方式无法对包含在非结构数据内部的大量信息进行有效管理。NoSQL(NotOnlySQL),泛指非关系型的数据库,采用Key-Value模型等非二维关系模型存储数据。一般不需要预定义数据模式和表结构,数据中的每条记录都可以有不同的属性和格式。无共享架构,可以将数据划分后存储在多个服务器上。具有弹性可扩展性,可以在系统运行的时候,动态增加或者删除结点,数据可以自动迁移。在地质领域,非结构化数据占有很大的比例,而关系型数据库对非结构化数据的管理很不理想,NoSQL一般适用于数据模型比较简单,需要很高的灵活性,对数据库性能要求较高,不需要高度的数据一致性,对于给定键值(key),比较容易映射复杂值(Value)的环境。这种特性可以较好地实现地质数据中非结构化数据内部信息的有效管理。关系型数据库在数据一致性、规范性和高效检索等方面具有很大的优势,可高效管理各类结构化数据;NoSQL在灵活性、自由性等方面具有很大的优势,可方便深入到段落层面或图元层面,对非结构化数据的管理具有明显的优势。因而,目前地质数据的管理可以采用关系型数据库管理结构化数据,如SQLserver数据库,Oracle数据库等;采用NoSQL管理非结构化数据,如MongoDB、HBase或Redis等数据库。但是这两种数据库怎样有效地集成或融合,目前并没有一个成熟的方案。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术中还没有将关系型数据库与NoSQL进行有效集成或者融合的技术缺陷,提供一种关系型地质数据库与NoSQL的融合方法及系统。根据本专利技术的其中一方面,本专利技术为解决其技术问题,提供了一种关系型地质数据库与NoSQL的融合方法,该方法包含如下步骤:结构获取步骤:S11、获取设计好的非结构化数据的NoSQL存储结构;S12、依据该存储结构建立非结构化数据的索引信息连接表结构,形成关系型连接表;数据存储步骤:S21、接收非结构化数据的存储指令,开始存储数据;S22、依据所述NoSQL存储结构,将所述非结构化数据存储至NoSQL;S23、获取所述非结构化数据的内部要素的索引信息,将所述要素的索引信息存储至关系型连接表中;数据检索步骤:S31、接收数据检索指令,开始数据检索;S32、采用SQL方式从所述关系型连接表中检索相应的要素的索引信息,依据索引信息获得非结构化数据的要素信息或索引信息对应的非结构化数据。进一步地,在本专利技术的关系型地质数据库与NoSQL的融合方法中,所述索引信息包含所述非结构化数据的内部要素在NoSQL中的NoSQL唯一性ID、要素隶属关系以及存储位置。进一步地,在本专利技术的关系型地质数据库与NoSQL的融合方法中,所述关系型连接表是一种非结构化数据中各类要素的索引表,其中的字段是依据非结构化数据在NoSQL中的存储特征来选择的,用以指明非结构化数据中各类要素的隶属关系和存储位置。根据本专利技术的另一方面,本专利技术为解决其技术问题,还提供了一种关系型地质数据库与NoSQL的融合系统,包含如下结构获取模块、数据存储模块以及数据检索模块;结构获取模块包含:NoSQL存储结构获取子模块,用于获取设计好的非结构化数据的NoSQL存储结构;连接表结构设计子模块,用于依据该存储结构建立非结构化数据内部要素的索引信息连接表结构,形成关系型连接表;数据存储模块包含:存储指令接收子模块,用于接收非结构化数据的存储指令,开始存储数据;NoSQL存储子模块,用于依据所述NoSQL存储结构,将所述非结构化数据存储至NoSQL;连接表存储子模块,用于获取所述非结构化数据的要素的索引信息,将所述要素的索引信息存储至关系型连接表中;数据检索模块包含:检索指令接收子模块,用于接收数据检索指令,开始数据检索;SQL检索子模块,用于采用SQL方式从所述关系型连接表中检索相应的要素的索引信息,依据索引信息获得非结构化数据的要素信息或索引信息对应的非结构化数据。进一步地,在本专利技术的关系型地质数据库与NoSQL的融合系统中,所述索引信息包含所述非结构化数据的内部要素在NoSQL中的NoSQL唯一性ID、要素隶属关系以及存储位置。进一步地,在本专利技术的关系型地质数据库与NoSQL的融合系统中,所述非结构化数据为图形文件,所述索引信息包含:图形文件名、图层名、图元名、NoSQL唯一性ID以及存储位置;或,进一步地,在本专利技术的关系型地质数据库与NoSQL的融合系统中,所述关系型连接表是一种非结构化数据中各类要素的索引表,其中的字段是依据非结构化数据在NoSQL中的存储特征来选择的,用以指明非结构化数据中各类要素的隶属关系和存储位置。本专利技术提出的技术可以把关系型数据库和NoSQL有效地融合起来,既可以充分发挥NoSQL对非结构化数据灵活自由的管理功能,又可以充分利用关系型数据库的强大检索功能,从而使既含有大量结构化数据,又含有大量非机构化数据的地质大数据管理更加方便、高效,为地质大数据等的管理、分析、挖掘提供更好的支持与服务。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术的关系型地质数据库与NoSQL的融合方法的流程图;图2是本专利技术的NoSQL存储结构说明图。具体实施方式为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。参考图1,其为本专利技术的关系型地质数据库与NoSQL的融合方法的流程图,该方法包含如下结构获取步骤、数据存储步骤以及数据检索步骤。其中,结构获取步骤包括:S11、获取设计好的非结构化数据的NoSQL存储结构;S12、依据该存储结构建立非结构化数据内部要素的索引信息连接表结构,形成关系型连接表。如针对地质图图元在NoSQL中的存储特点,设计一个含有索引信息为“图形文件名、图层名、图元名、NoSQL唯一性ID、存储位置”等字段的结构化数据表(关系型连接表),其他类型的非结构化数据的处理方法类似,如针对文档类段落在NoSQL中的存储特点,该文档段落层面的数据表可以设计为一个含有类似“文件名、段落序号、段落中出现的词、该词的词频、NoSQL唯一性ID、存储位置”等字段作为索引信息的结构化数据表。数据存储步骤包含下述的步骤S21-S23。S21、接收非结构化数据的存储指令,开始存储数据。S22本文档来自技高网
...

【技术保护点】
1.一种关系型地质数据库与NoSQL的融合方法,其特征在于,包含如下步骤:结构获取步骤:S11、获取设计好的非结构化数据的NoSQL存储结构;S12、依据该存储结构建立非结构化数据内部要素的索引信息连接表结构,形成关系型连接表;数据存储步骤:S21、接收非结构化数据的存储指令,开始存储数据;S22、依据所述NoSQL存储结构,将所述非结构化数据存储至NoSQL;S23、获取所述非结构化数据内部要素的索引信息,将所述要素的索引信息存储至关系型连接表中;数据检索步骤:S31、接收数据检索指令,开始数据检索;S32、采用SQL方式从所述关系型连接表中检索相应的要素的索引信息,依据索引信息获得非结构化数据的要素信息或索引信息对应的非结构化数据。

【技术特征摘要】
1.一种关系型地质数据库与NoSQL的融合方法,其特征在于,包含如下步骤:结构获取步骤:S11、获取设计好的非结构化数据的NoSQL存储结构;S12、依据该存储结构建立非结构化数据内部要素的索引信息连接表结构,形成关系型连接表;数据存储步骤:S21、接收非结构化数据的存储指令,开始存储数据;S22、依据所述NoSQL存储结构,将所述非结构化数据存储至NoSQL;S23、获取所述非结构化数据内部要素的索引信息,将所述要素的索引信息存储至关系型连接表中;数据检索步骤:S31、接收数据检索指令,开始数据检索;S32、采用SQL方式从所述关系型连接表中检索相应的要素的索引信息,依据索引信息获得非结构化数据的要素信息或索引信息对应的非结构化数据。2.根据权利要求1所述的关系型地质数据库与NoSQL的融合方法,其特征在于,所述索引信息包含所述非结构化数据的内部要素在NoSQL中的NoSQL唯一性ID、存储位置以及要素的隶属关系。3.根据权利要求2所述的关系型地质数据库与NoSQL的融合方法,其特征在于,所述非结构化数据为图形文件,所述索引信息包含:图形文件名、图层名、图元名、NoSQL唯一性ID以及存储位置;或,所述非结构化数据为文档文件,所述索引信息包含:文件名、段落序号、段落中出现的词、该词的词频、NoSQL唯一性ID、存储位置。4.根据权利要求1所述的关系型地质数据库与NoSQL的融合方法,其特征在于,所述关系型连接表是一种非结构化数据中各类要素的索引表,其中的字段是依据非结构化数据在NoSQL中的存储特征来选择的,用以指明非结构化数据中各类要素的隶属关系和存储位置。5.一种关系型地质数据库与NoSQL的融合系统,其特征在于,包含如下结构获取模块、数...

【专利技术属性】
技术研发人员:刘军旗吴冲龙姚梦辉苏爱军唐辉明刘刚张志庭
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1