【技术实现步骤摘要】
一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统
本专利技术涉及数据管理与共享服务领域,尤其涉及一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统。用户可以统一实现将分布式异构数据进行逻辑的汇聚组织、集中发布审核监控与集成共享服务。
技术介绍
伴随着云计算、大数据、人工智能技术给人类社会信息化发展带来极大的促进作用,人们对数据资源的重要性的认识也越来越深刻,已经上升到国家重要的战略资源的层面。同时,促进数据融合、开放共享的需求也越来越强烈,国家也出台了“以数据集中和共享为途径,建设全国一体化的国家大数据中心的发展战略”。社会各领域各层级数据中心,数据资源共享服务平台正在不断建立。目前数据共享服务平台的数据资源大多组织成数据集形式提供共享,包括元数据和实体数据。其中数据集元数据由于信息存储量较少,容易集中汇集存储,而实体数据是数据资源的核心,受集中存放意愿,集中的存储环境等多种情况制约,在某些条件下无法进行数据资源物理汇聚(即实体数据集中汇集,统一集中存储),需要实现数据资源逻辑汇聚(即实体数据仍然分散存储,通过数据访问接口进行集成共享服务)。目前数据资源逻辑汇聚中,实体数据多以文件接口或数据访问页面URL的形式提供,严重影响了数据服务的构建和服务体验,存在以下不足:(1)缺乏一个通用可定制的异构数据逻辑汇聚组织封装、发布与共享服务的一体化解决方法,现有的平台仅支持局限的某个或某些过程的服务子集;并且现有平台多为根据建设需求专门化的设计开发,缺乏定制化、通用 ...
【技术保护点】
1.一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法,其特征在于,包括以下步骤:/n1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;/n2)在分布端进行分布式异构数据的建库、管理与描述;/n3)在分布端进行分布式异构数据的统一封装与发布组织;/n4)在中心端进行数据资源集中发布审核与监控;/n5)在中心端进行数据资源的集成共享服务。/n
【技术特征摘要】
1.一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法,其特征在于,包括以下步骤:
1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;
2)在分布端进行分布式异构数据的建库、管理与描述;
3)在分布端进行分布式异构数据的统一封装与发布组织;
4)在中心端进行数据资源集中发布审核与监控;
5)在中心端进行数据资源的集成共享服务。
2.根据权利要求1所述的方法,其特征在于,所述数据节点注册实现分布端数据节点信息及节点管理员认证信息的注册管理;
所述元数据扩展要素注册,支持扩展元数据项的定制化配置管理,元数据配置项包括:元数据中文名、元数据英文名称、字段类型、是否必填项、是否重复、排序号、备注;
所述数据分类体系注册,支持树状数据分类体系的注册、编辑、删除操作,分类体系信息包括:分类名称、分类代码、分类描述,用户能够对任意树状分类体系节点信息进行新增、编辑,插入和删除操作;
所述许可协议注册,支持标准的许可协议,同时支持自定义许可内容的注册、编辑、删除操作,注册信息包括协议标识码、协议名称,协议标识图片,协议说明文本。
3.根据权利要求2所述的方法,其特征在于,所述数据节点注册,其中数据节点的属性信息包括:数据节点名称、节点代码、节点简介、节点URL地址、节点联系人、联系电话、Email、节点管理员账号、节点管理员密码、数据节点创建时间、序号;所述元数据扩展要素注册,包括以下元数据要素:数据集唯一持久标识、数据集封面、数据集名称、数据集简介、关键词、分类编码、开始时间、结束时间、创建机构、创建人员、最新创建/更新日期、发布机构、联系邮件、联系电话、最新发布日期、许可协议、引用格式、总存储量、总文件数、总记录数。
4.根据权利要求1所述的方法,其特征在于,所述分布式异构数据的建库、管理与描述,包括:
2.1)进行异构数据源注册,包括关系型数据源和文件型数据源的统一注册连接管理;
2.2)进行异构数据源连接,包括关系型数据源和文件型数据源的统一选定和连接;
2.3)进行关系型数据建表,包括通过Excel模板导入创建新的关系型数据库,或者通过关联已存在的且已描述的关系型数据表创建新表;
2.4)进行关系库表描述与融合配置,实现分布端选定的关系数据源下关系表结构信息的描述与融合配置;
2.5)进行关系库表数据管理,实现分布端选定的关系数据源下全部关系表的数据管理,支持数据查看、添加、编辑、删除操作;
2.6)进行文件型数据管理,实现分布端选定的文件数据源下全部数据文件、目录的网盘式管理。
5.根据权利要求4所述的方法,其特征在于,所述关系库表描述,包括描述关系数据表名称,描述关系型数据表字段名称;所述融合配置,是通过设置关系数据表某字段显示类型实现融合配置,包括文本类型、URL类型、字典枚举类型、关联子表类型。
6.根据权利要求1所述的方法,其特征在于,所述分布式异构数据的统一封装与发布组织,包括:
3.1)进行实体数据访问接口封装,实现分布端实体数据访问接口的统一封装管理;
3.2)进行公共基础数据同步,基于公共基础数据注册中中心端封装的各类基础数据的获取接口的调用,实现从中心端同步访问获取最新的数据资源节点信息、扩展元数据信息、数据分类体系信息和许可协议信息存储到分布端,并保证信息同步的准确和稳定;
3.3)进行数据集元数据填报,包括基于内置元数据和扩展元数据,动态实现数据集元数据的逐条在线填报和批量填报;
3.4)进行实体数据选定与接口填报,包括基于分布端关系库表和文件系统,实现在线关系型实体数据表的选定和基于文件目录体系的实体数据文件的选定,同时支持文件的在线即刻上传选定;并基于实体数据访问接口的封装,根据用户...
【专利技术属性】
技术研发人员:刘峰,陈昕,夏景隆,韩芳,周园春,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。