一种分布式地学元数据同步实现方法及系统技术方案

技术编号:3852155 阅读:242 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种分布式地学元数据同步实现方法及系统,该方法包括:地学元数据同步服务部署步骤,用于将地学元数据操作功能封装成的地学元数据同步服务,并部署该地学元数据服务在总中心和分中心的网络服务器上;地学元数据同步实施步骤,基于所述地学元数据同步服务进行分中心和总中心的地学元数据同步。本发明专利技术解决了分布式软件体系下地学元数据的实时推送和同步的问题。

【技术实现步骤摘要】

本专利技术涉及地学元数据同步技术,特别涉及一种分布式地学元数据同步实 现方法及系统。
技术介绍
通过各行业部门部署的对地球表面及深部的长期调查监测以及各类地学 科研项目,我国已经积累了丰富的地学数据资源。特别是随着近几十年来对地 观测技术的发展,地学数据资源的获取变得越来越容易。然而,由于缺乏有效 的地学数据共享,数据资源难以流通,分布在不同地理位置、行业部门和科研 单位的数据资源主要还是在数据采集、生产单位内部使用,行业部门和科研项 目往往为了不同的目的重复进行数据资源的投资和建设。地学数据资源是在一 定时空范围下产生的,具有典型的时空特性、区域集成性、学科交叉性,数据 类型和格式复杂多样。因此,实现分散、异构地学数据资源共享的一种行之有 效的办法就是元数据。元数据是关于数据的数据,能够对数据资源的主要内容、时空范围、数据 格式、数据质量以及数据资源的获取方式进行描述。数据拥有者通过元数据告 诉数据使用者有什么样的数据、这些数据在哪里、怎么获取这些数据资源等信 息,数据使用者根据上述信息通过在线下载或离线联系等方式获取数据,从而 实现地学数据资源的共享。以元数据为核心的数据共享系统一般分为集中式和分布式。集中式数据共 享系统是指数据拥有者基于网络将数据资源统一汇交到一个数据共享系统中, 数据使用者也都从这个共享系统中査询和获取所需要的数据资源。分布式数据 共享系统是指根据地域或学科的需求,设置多个物理上分布、逻辑上统一的数 据共享系统,数据拥有者根据数据资源的特点将数据资源汇交到对应的数据共 享系统中,数据使用者登录到某一个数据共享系统中査询和获取自己所需要的 数据资源。集中式数据共享系统由于只依靠一个数据共享系统进行元数据的汇交、数据的查询和获取,具有简单、容易维护等优点,但由于所有的数据服务 都依靠一个系统进行,因此也存在着网络负担过重,不同学科或区域数据资源 难于管理等问题。分布式数据共享系统依靠物理上分布、逻辑上统一的多个数 据共享系统对外提供服务,各个学科或区域数据共享系统能够很好地对本学科 或本区域的数据资源进行管理,当然分布式的数据共享系统相对于集中式的数 据共享系统要复杂得多,而且要想这些分布式的系统能够统一为用户提供数据 共享服务,必须解决分布式系统间元数据的同步。由于地学数据资源具有典型 的时空特性、区域集成性和学科交叉性等特点,因此,地学数据资源的共享往 往采用分布式的网络体系。分布式的地学元数据同步一般来讲有两种形式对等式和总分式。所谓对 等式地学元数据同步是指分布式网络体系下的每个系统都是对等的,各系统的 元数据分别要同步到其他系统中;总分式地学元数据同步是指分布式网络体系 下有一个系统作为总中心,其他系统作为分中心,总中心和分中心是不对等的, 所有分中心的元数据都同步到总中心,通过总中心实现元数据的全局搜索和访 问。对等式的元数据同步机制由于一个系统的元数据需要分别同步到其他的每 一个系统,如果分布式体系下的系统数量多的话,这种同步工作所消耗的开支 是巨大的,而且任何一个系统出问题都会对这种同步产生影响。总分式的元数 据同步机制中各分中心只与总中心进行元数据的同步,分中心相互之间并不进 行元数据同步,依靠总中心可以对各分中心的元数据质量进行监控,并提供全 局的元数据服务,这种机制效率高、相对稳定,但对总中心要求较高。本专利技术 涉及的就是一种总分式的分布式元数据同步管理的方法。分布式元数据同步管理主要依靠的协议包括Z39.50、 OAI-PMH和Web Services 。Z39.50是"信息检索应用服务定义和协议规范"的简称,是美国国家标准 化组织于1988年公布的。它是在网络上传输数据的高层协议,不涉及数据库 的名称和具体结构,也不考虑数据库的具体实现,能够实现异构元数据的互操 作。基于Z39.50的分布式信息检索的具体步骤是首先将Z39.50网关安装在 网络服务器上,当用户发送检索请求时,Z39.50网关将其转化为Z39.50支持 的标准格式,然后创建若干个并发的Z39.50客户进程,将用户检索请求同时 递交给用户选定的多个Z39.50服务器,最后接收多个Z39.50服务器返回的检5索结果,经过处理后转化为HTML格式,返回给用户。Z39.50存在的主要问 题是它是一个重量级的协议,体系庞大,标准的实施需要软件开发者了解数 据结构、网络通讯、编码解码等,是一种复杂的操作模式,这使其在通用领域、 一般检索和P2P检索中的应用受到很大局限。OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting,简称 OAI)协议是美国数字图书馆联盟、网络信息联盟等组织提出的一个应用框架, 其目的是实现分散的、不同系统平台之间的元数据交换和共享。OAI协议支持 两种角色数据提供者和服务提供者。数据提供者对来自服务提供者的请求做 出响应,以OAI要求的格式向服务提供者提供元数据;服务提供者利用收割 器收割元数据。OAI协议存在的主要问题 一是规定数据提供方必须统一使用 都柏林元数据标准,非都柏林元数据在使用之前要先进行转换;二是采用收割 机制,会因为频繁收割加重系统的负担,特别是数据提供方元数据变化不大时, 会造成资源的巨大浪费。上述两种协议采用的都是"收割"方式的元数据同步,元数据全局搜索 时总中心每次都要去收割分中心的元数据或者是定时收割一次,每次都到分中 心去收割存在耗时过长的问题,而定时收割又存在元数据搜索结果不实时的问 题。同时,这种机制总中心无法对收割上来的分中心元数据质量进行控制。
技术实现思路
本专利技术所要解决的技术问题在于,提供一种分布式地学元数据同步实现方法及系统,解决分布式软件体系下地学元数据的实时推送和同步的问题,提高分布式地学元数据的质量。为达到上述目的,本专利技术提供的分布式地学元数据同步实现方法,包括 地学元数据同步服务部署步骤,用于将地学元数据操作功能封装成的地学元数据同步服务,并部署该地学元数据服务在总中心和分中心的网络服务器上;地学元数据同步实施步骤,基于所述地学元数据同步服务进行分中心和总 中心的地学元数据同步。上述分布式地学元数据同步实现方法,其特征在于,所述地学元数据同步 服务部署步骤进一步包括步骤SlOl,利用网络服务技术将地学元数据操作的功能函数封装成地学元数据同步服务;步骤S102,将所述封装成的地学元数据同步服务部署在总中心和分中心 的网络服务器上。上述分布式地学元数据同步实现方法,其特征在于,所述地学元数据操作 的功能函数主要包括判断元数据是否存在的函数existedMetdata、添加元数 据的函数addMetadata、更新元数据的函数updateMetadata、删除元数据的函数 deleteMetadata、获取元数据状态的函数getMetadataState、更新元数据状态的 函数updateMetadataState和获取元数据的函数getMetadata。上述分布式地学元数据同步实现方法,其特征在于,所述地学元数据的标 准包括标识信息、内容信息、分发信息、数据质量和元数据参考信息。上述分布式地学元数据同步实现方法,其特征在于,所述总中心和分中心 根据本文档来自技高网
...

【技术保护点】
一种分布式地学元数据同步实现方法,其特征在于,包括: 地学元数据同步服务部署步骤,用于将地学元数据操作功能封装成地学元数据同步服务,并部署该地学元数据服务在总中心和分中心的网络服务器上; 地学元数据同步实施步骤,基于所述地学元数 据同步服务进行分中心和总中心的地学元数据同步。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨雅萍冯敏诸云强宋佳廖顺宝
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1