一种多源、多维地学信息数据集成方法技术

技术编号:18426340 阅读:207 留言:0更新日期:2018-07-12 01:59
本发明专利技术属于高放废物地质处置地学信息技术领域,具体涉及一种多源、多维地学信息数据集成方法。本发明专利技术包括如下步骤:步骤1、理清数据对象的特征和分类编码;步骤2、数据实体分类;步骤3、数据库元数据字典编码设计;步骤4、数据集成模型构建。本发明专利技术能够构建对多源地学信息数据进行高效和完整集成的数据模型。

A multi-source, multi-dimensional geoscience data integration method

The invention belongs to the geoscience information technology field of high level radioactive waste geological disposal, and specifically relates to a multi-source, multi-dimensional geoscience data integration method. The present invention includes the following steps: Step 1, clarify the characteristics and classification coding of data objects; step 2, data entity classification; step 3, database metadata dictionary coding design; step 4, data integration model construction. The invention can construct a data model for efficient and complete integration of multi-source geoscience data.

【技术实现步骤摘要】
一种多源、多维地学信息数据集成方法
本专利技术属于高放废物地质处置地学信息
,具体涉及一种多源、多维地学信息数据集成方法。
技术介绍
随着我国地质勘查行业和信息
的快速发展,地学信息数据越来越多地摆脱传统的纸质文档或电子文件形式,逐渐转向以数据库管理系统存储方式为主。高放废物地质处置领域的地学信息数据涉及学科较多、来源较为复杂,同时又会存在随时间尺度而发生变化的特点,因此,必须研究并开发一种数据集成方法,以便实现对多源、多维地学信息数据实现高效的存储和管理。
技术实现思路
本专利技术解决的技术问题:本专利技术提供一种多源、多维地学信息数据集成方法,能够构建对多源地学信息数据进行高效和完整集成的数据模型。本专利技术采用的技术方案:一种多源、多维地学信息数据集成方法,包括如下步骤:步骤1、理清数据对象的特征和分类编码;步骤2、数据实体分类;步骤3、数据库元数据字典编码设计;步骤4、数据集成模型构建。所述步骤1包括如下步骤:步骤1.1、数据对象的特征分析;步骤1.2、数据对象的分类;步骤1.3、确定数据实体分类编码规则。所述步骤1.1中,确定数据对象特征为:多源性、多维性和动态性。所述步骤1.2中,预选区地学信息数据实体的分类主要按专题分类和表现形式分类的二种方式。所述步骤1.3中,分类代码采用8位字符码,分别为按数字顺序排列的门类、大类、中类、小类、子类,其中,门类:用英文字母A-Z表示,为学科专题;大类:在门类基础上细分形成的要素类,用数字或字符表示;中类:在大类基础上细分形成的要素类,用数字或字符表示;小类:在中类基础上细分形成的要素类,用两位数字00-99表示;子类:在小类基础上细分形成的要素类,用两位数字00-99表示。所述步骤3中,将步骤2中设计的数据库结构进行有机的联系和整合。所述步骤4中,按照步骤1整理的多源、多维数据之间的相互关系,以数据库结构设计和元数据字典编码设计为基础,构建同一专题数据库不同表结构之间、不同专题数据库结构之间的有机关联,实现全部地学信息数据模型的集成构建。本专利技术的有益效果:本专利技术提供一种多源、多维地学信息数据集成方法,有利于全面掌控和系统分析处置库预选区数据资源、深入理解高放废物地质处置的应用需求,解决多源数据实体合理的分类体系、复杂的逻辑关系、有效的物理存储结构等关键问题,突破传统行业应用中的数据分类和常规的空间数据组织模式,实现以独立、完整、具有高放废物地质处置领域特色应用意义的数据实体与空间关系为基本单位的数据组织与集成。附图说明图1:专题数据要素分类编码。具体实施方式下面结合附图和具体实施例对本专利技术提供的一种多源、多维地学信息数据集成方法作进一步详细说明。本专利技术提供的一种多源、多维地学信息数据集成方法,包括如下步骤:步骤1、理清数据对象的特征和分类编码步骤1.1、数据对象的特征:高放废物地质处置库预选区的所有数据是对地质体及自然地理环境的时空间特征和理化属性的描述。根据对收集的已有资料所建立的非结化数据库内容分析,这些数据实体是多学科领域、多种方法、不同测试环境条件下获取,数据实体的存在形式为图形、图像(片)、文档、数表、数据包(数据文件)等,具有多源(不同学科的多种获取方法)、多维(时间与三维空间)和动态(时序变化)特征:多源性:数据产生与来源多样性;对预选区对象的描述信息来自不同学科专题领域,通过不同技术方法在多种环境条件下获得的多学科领域数据。在进行数据模型设计时,需在元数据中详细体现数据实体的获取方式、时间域等多源性特征。多维性:空间三维,时间一维,属性多维。处置库预选区所有数据均直接或间接的与地理空间位置相关,在数据模型中的所有数据均定义为空间数据,对非空间数据也采用模糊空间范围表述(除引用标准、参考国内外数据资料外),因为,对高放废物地质处置领域预选区而言,即使是预选区的研究报告文档,也是针对具体的预选区范围。空间图形表现为水平面和剖面。时序特性体现在跨越地质时代及动态监测数据,连续时间段或间歇监测获取的同类型数据,同时,数据产生与存在周期包括从选址的区域调查、场址特性评价、场址确认阶段至处置库建设、运行和关闭阶段。属性多维性则是因数据多源性产生多种属性。动态性:同一数据对象在选址过程中不同调查观测阶段和不同学科领域中,存在数据实体的描述、精度及专题的应用需求上的差异,对同一属性亦有多种不同表述方式或数据实体的存在形式不同,同时,大量测试数据具有时间序列特征。步骤1.2、数据对象的分类:预选区地学信息数据实体的分类主要按专题分类和表现形式分类的二种方式。其中专题数据类型按从属关系依次分为五类:门类、大类、中类、小类、子类,所有数据实体均对应有唯一的数据分类编码,同一专题分类编码的数据实体在空间上可划分为点、线、面及栅格图像等不同形式表示。数据存储形式分类按数据实体的存储结构划分。其中空间图形的拓扑关系采动态建立简单空间几何图形(OGCSimpleGeometry)之间的相邻、相交、叠置、包含的方式获得。数据要素分类编码是针对所有高放废物处置库预选区数据实体进行科学分类与统一编码,从门类、大类、中类至子类依次进行划分。其目的是确保数据无歧义,并对实体描述的精准性进行限定,在不能精确获取描述对象详细信息的情况下,采用上一级代码表示,如对地质体岩性的描述,在不能确定是否为“白云母花岗岩”的情况下,使用其上一级代码中类“花岗岩”进行描述,依此类推。在数据模型的物理结构中对所有数据均定义“GDF_CODE”指示其分类。步骤1.3、数据实体分类编码规则:要素分类采用线分类法,要素类型按从属关系依次分为五类:门类、大类、中类、小类、子类。其中门类包括:按学科专题区分(中华人民共和国学科分类与代码简表,国家标准GBT13745-2009),为基础地理数据、基础地质数据、基础影像数据、人文经济数据、钻探工程数据、水文地质数等;大类在上述各类基础上划分;中类在大类的基础上进行划分,再确定小类、子类;各类不得重新定义,根据需要可进行扩充。分类代码采用8位字符码,分别为按数字顺序排列的门类、大类、中类、小类、子类,具体代码结构如图1所示,其中,门类:用英文字母A-Z表示,为学科专题;大类:在门类基础上细分形成的要素类,用数字或字符表示;中类:在大类基础上细分形成的要素类,用数字或字符表示;小类:在中类基础上细分形成的要素类,用两位数字00-99表示;子类:在小类基础上细分形成的要素类,用两位数字00-99表示。步骤2、数据实体分类根据高放废物处置库预选区地学环境信息的主要特征,门类参照《中华人民共和国学科分类与代码简表》(国家标准GBT13745-2009)按学科专题分类,将高放废物地质处置数据库划分为基础地理、基础地质、水文地质勘等要素,但由于各学科领域的分类标准差异,并且采用的编码方式也各不相同,包括编码的位数都不一样。为方便在高放废物地质处置领域的应用,根据数据要素分类编码的原则,对应用原代码重新进行统一编码,在门类基础上进行大类和中类的划分,形成高放废物地质处置地学信息数据库要素分类:表1专题数据门类分类代码表以基础地理数据GDF代码为例,该类数据原始数据已按国家基础地理信息分类代码,引入至高放废物地质处置地学信息库中在原分类代码前+BM(本系统定义的门类B本文档来自技高网...

【技术保护点】
1.一种多源、多维地学信息数据集成方法,其特征在于:包括如下步骤:步骤(1)、理清数据对象的特征和分类编码;步骤(2)、数据实体分类;步骤(3)、数据库元数据字典编码设计;步骤(4)、数据集成模型构建。

【技术特征摘要】
1.一种多源、多维地学信息数据集成方法,其特征在于:包括如下步骤:步骤(1)、理清数据对象的特征和分类编码;步骤(2)、数据实体分类;步骤(3)、数据库元数据字典编码设计;步骤(4)、数据集成模型构建。2.根据权利要求1所述的一种多源、多维地学信息数据集成方法,其特征在于:所述步骤(1)包括如下步骤:步骤(1.1)、数据对象的特征分析;步骤(1.2)、数据对象的分类;步骤(1.3)、确定数据实体分类编码规则。3.根据权利要求2所述的一种多源、多维地学信息数据集成方法,其特征在于:所述步骤(1.1)中,确定数据对象特征为:多源性、多维性和动态性。4.根据权利要求2所述的一种多源、多维地学信息数据集成方法,其特征在于:所述步骤(1.2)中,预选区地学信息数据实体的分类主要按专题分类和表现形式分类的二种方式。5.根据权利要求2所述的一种多源、多维地学信息数据集成方法,其特征在于:所述步骤(...

【专利技术属性】
技术研发人员:赵永安黄树桃王鹏
申请(专利权)人:核工业北京地质研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1