本发明专利技术涉及一种基于标识技术的数据共享和管理方法及系统。该方法包括数据标识服务节点搭建、数据标识配置机制、数据标识解析方法、异构入口数据捕获等内容。数据标识服务节点搭建是数据信息共享的基础设施,包括根节点和叶子节点构建和异构识别机制构建;数据标识配置机制是数据标识化管理的基础;数据标识解析方法是标识节点找到目标数据库并返回共享信息的过程,包括解析机制和中间件;异构入口数据捕获提供一种标识在不同数据捕获入口均可获得数据的共享信息机制。本发明专利技术在不需要改变数据现有管理方法,不需要充分理解其他应用中数据结构和通信方式,不需要将数据上传至统一平台的情况下,实现了数据分布式共享和管理。
【技术实现步骤摘要】
一种基于标识技术的数据共享和管理方法及系统
本专利技术属于信息
,具体涉及一种基于标识技术的数据共享和管理方法及系统,适用于科学研究等领域产生的数据的开放共享和管理。
技术介绍
随着信息技术的精细化发展,越来越多的行业领域采用信息化手段管理资源,资源数据管理逐渐成为核心要素,在科学研究领域尤为凸显。科学研究领域主要包括科研院所、高校、社会研究机构等多个方面,学科种类繁多,随着科研仪器及信息化水平的提高,各学科产生了大量领域内分散科学数据,范围涉及资源、环境、生物、生态、医疗等领域。然而大部分科学数据由于缺乏有效的管理,导致使用频次极低,限制了科学数据价值的发挥,严重影响科研进度及数据精度。另一方面,我国重大科研战略计划的顺利实施亟需从纷繁庞杂的数据中挖掘有价值的信息与知识,推动来源广泛、内容丰富、质量可靠的数据及共享和管理方法的构建,以便于快速及时、科学精准地做出决策。因此,如何突破数据开放共享的瓶颈,实现数据、模型与服务等全面集成成为我国科技创新的重中之重。目前,国内外相关数据服务平台研究机构已初步开展针对数据共享及管理相关研究,各种标识体系基于开放的API接口方式捕获数据。基于标识技术的数据共享和管理方式是近年来新兴的模式,目前主要包括国际Handle标识系统、Handle标识体系下的DOI数字对象标识系统,我国针对科学仪器等科研资源的CSTR科技资源标识,我国针对新闻出版物的ISLI关联标识体系。(1)DOI数字对象标识系统编码结构DOI的编码方案(ANSI/NISOZ39.84-2000)规定,一个DOI由两部分组成:前缀和后缀,中间用“/”分割。DOI前缀由DOI标识应用代码“10”和登记机构代码(由DOI管理机构DONA分配)构成,DOI后缀由登记机构分配给数字资源,并保证其唯一性。编码数据结构为:10.“登记机构代码”/“后缀”示例:10.11899/zzfy2014020110为DOI标识应用代码11899为登记机构代码,此处为“震灾防御技术”期刊Zzfy20140201为数字文章唯一代码,由以上期刊分配。(2)CSTR科技资源标识编码结构科技资源标识符由中国科技资源代号(CSTR)、科技资源标识注册机构代码、科技资源类型代码和内部标识符四部分组成。中国科技资源代号与科技资源标识注册机构代码之间用半角符号“:”分隔,其余各部分之间用半角符号“.”进行分隔,见图1。(3)新闻出版物的ISLI关联标识编码结构ISLI编码由十进制数字构成,分为服务字段、关联字段和校验字段三个字段,见图2,其中服务字段的服务编码由注册机构分配,关联字段包含关联编码,由注册机构分配。(4)handle数字对象标识系统handle是由不同字符构成的字符串。HandleSystem中的每个handle由两部分组成:handle的命名授权部分(namingauthority)以及跟随其后的在该命名授权下唯一的本地名称(localname)。命名授权(简称NA)和本地名称间通过“/”来分开,表达式为:<Handle>=<NamingAuthority>"/"<LocalName>然而,以上标识系统仅考虑了标识体系内的解析和互通,目前数据服务平台仅支持采用一种标识体系的数据共享,对于采用不同类型标识体系之间的数据共享存在以下问题:(1)数据服务平台无法识别不同的标识种类,需要开发异构识别模块,用于识别不同的标识体系,兼容性和可扩展性较为局限。(2)数据服务平台缺乏统一的标识数据捕获入口,需要针对不同的标识体系要求,开发多个不同的API数据接口,效率较低,缺乏一致性。(3)标识体系数据捕获入口仅能查询其自身标识,无法实现对其他标识体系数据捕获的支撑。
技术实现思路
本专利技术旨在提供一个更加合理的基于标识技术的数据共享和管理方法及系统,解决数据标识异构,缺乏一致的、可实施的信息共享和管理的问题,特别是在共享过程中涉及跨领域跨标识体系数据共享的可行性问题。本专利技术采用的技术方案如下:一种基于标识技术的数据共享和管理方法,包括以下步骤:1)建立数据标识服务节点,包括根节点和标识体系叶子节点;所述标识体系叶子节点向所述根节点注册节点服务地址和编码规则;2)通过所述标识体系叶子节点为数据库中的数据配置标识,并基于数据库建立所述标识体系叶子节点的下级叶子节点;3)通过建立的数据标识服务节点接收客户端的标识解析请求,对标识解析请求中的数据标识进行解析,并将与该数据标识对应的数据库中的数据访问地址发送给客户端。进一步地,所述标识体系叶子节点是基于不同标识体系建立的若干叶子节点,包括CSTR叶子节点、DOI叶子节点、Handle叶子节点、ISLI叶子节点。进一步地,所述标识体系叶子节点为数据库中的数据配置标识包括:对于数据未采用标识的数据库,调用标识前缀申请及分配机制,即选择标识体系(可为现有标识体系,也可为自定义标识体系),向标识体系叶子节点注册其数据库的中间件地址;标识体系叶子节点向数据库中间件分配标识前缀,并记录标识前缀与数据库中间件地址的映射关系;数据库根据所分配的标识前缀,自定义标识后缀,生成完整数据标识代码,将每项数据的URL、数据标识代码写入数据库;对于已有数据标识的数据库,调用标识登记机制,向所使用的标识体系叶子节点登记标识前缀和数据库中间件地址,标识体系叶子节点记录标识前缀和数据库中间件地址,并建立标识前缀与数据库中间件地址的映射关系。进一步地,所述数据标识服务节点中,各级叶子节点与上级节点对接,将数据标识类型、子节点地址注册至上级节点;上级节点记录该子节点数据类型、子节点地址,为子节点分配节点代码,并将节点代码与数据类型、子节点地址信息相关联;各级节点负责数据类型识别、本级节点管理、向上级节点注册以及下级节点分配和管理。进一步地,步骤3)对数据标识进行解析的步骤包括:客户端向根节点发起标识解析请求,调用根节点的API接口,根节点解析标识类型,若成功匹配则将数据标识代码发送至下级叶子节点,若匹配失败则返回错误信息;下级叶子节点解析数据标识代码的前缀,若匹配则将数据标识代码的后缀发送至匹配的数据库中间件地址;中间件将API接口查询语言转换为数据库语言,查找数据标识代码所对应的数据访问地址,并将结果返回客户端。进一步地,步骤3)采用异构入口数据捕获机制对数据标识进行解析,其步骤包括:(1)客户端向任一级子节点或根节点发起标识解析请求;(2)收到标识解析请求的子节点或根节点将数据标识代码与其所记录的数据类型相匹配,若匹配成功则进行步骤(3),若失败则进行步骤(4);(3)如果数据类型匹配成功,该级节点解析数据标识代码中相应的数据段代码,若与本级代码相同,则将数据标识代码中的后段代码发送至相应的下级节点,按照这种方式逐级进行,至最后一级节点,进行步骤(5);若任一级匹配错误,则进行步骤(6);(4)如果数据类型匹配失败,该级节点向上级节点发送标识解析请求,若成功则进行步骤(3),若请求至根节点的后仍匹配失败,则进行步骤(6);(5)向客户端返回匹配成功的状态信息和数据的数据库地址,客户端向数据的数据库发送标识解析请求,数据库向客户端返回相应本文档来自技高网...
【技术保护点】
一种基于标识技术的数据共享和管理方法,其特征在于,包括以下步骤:1)建立数据标识服务节点,包括根节点和标识体系叶子节点;所述标识体系叶子节点向所述根节点注册节点服务地址和编码规则;2)通过所述标识体系叶子节点为数据库中的数据配置标识,并基于数据库建立所述标识体系叶子节点的下级叶子节点;3)通过建立的数据标识服务节点接收客户端的标识解析请求,对标识解析请求中的数据标识进行解析,并将与该数据标识对应的数据库中的数据访问地址发送给客户端。
【技术特征摘要】
1.一种基于标识技术的数据共享和管理方法,其特征在于,包括以下步骤:1)建立数据标识服务节点,包括根节点和标识体系叶子节点;所述标识体系叶子节点向所述根节点注册节点服务地址和编码规则;2)通过所述标识体系叶子节点为数据库中的数据配置标识,并基于数据库建立所述标识体系叶子节点的下级叶子节点;3)通过建立的数据标识服务节点接收客户端的标识解析请求,对标识解析请求中的数据标识进行解析,并将与该数据标识对应的数据库中的数据访问地址发送给客户端。2.如权利要求1所述的方法,其特征在于,所述标识体系叶子节点是基于不同标识体系建立的若干叶子节点,包括CSTR叶子节点、DOI叶子节点、Handle叶子节点、ISLI叶子节点。3.如权利要求1所述的方法,其特征在于,所述标识体系叶子节点为数据库中的数据配置标识包括:对于数据未采用标识的数据库,调用标识前缀申请及分配机制,即选择标识体系,向标识体系叶子节点注册其数据库的中间件地址;标识体系叶子节点向数据库中间件分配标识前缀,并记录标识前缀与数据库中间件地址的映射关系;数据库根据所分配的标识前缀,自定义标识后缀,生成完整数据标识代码,将每项数据的URL、数据标识代码写入数据库;对于已有数据标识的数据库,调用标识登记机制,向所使用的标识体系叶子节点登记标识前缀和数据库中间件地址,标识体系叶子节点记录标识前缀和数据库中间件地址,并建立标识前缀与数据库中间件地址的映射关系。4.如权利要求1所述的方法,其特征在于,所述数据标识服务节点中,各级叶子节点与上级节点对接,将数据标识类型、子节点地址注册至上级节点;上级节点记录该子节点数据类型、子节点地址,为子节点分配节点代码,并将节点代码与数据类型、子节点地址信息相关联;各级节点负责数据类型识别、本级节点管理、向上级节点注册以及下级节点分配和管理。5.如权利要求1所述的方法,其特征在于,步骤3)对数据标识进行解析的步骤包括:客户端向根节点发起标识解析请求,调用根节点的API接口,根节点解析标识类型,若成功匹配则将数据标识代码发送至下级叶子节点,若匹配失败则返回错误信息;下级叶子节点解析数据标识代码的前缀,若匹配则将数据标识代码的后缀发送至匹配的数据库中间件地址;中间件将API接口查询语言转换为数据库语言,查找数据标识代码所对应的数据访问地址,并将结果返回客户端。6.如权利要求1所述的方法,其特征在于,步骤3)采用异构入口数据捕获机制对数据标识进行解析,...
【专利技术属性】
技术研发人员:刘佳,田野,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。