【技术实现步骤摘要】
一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法及系统
本专利技术涉及数据管理与共享服务领域,尤其涉及一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法及系统。用户可以统一实现将异构数据进行物理的汇聚传输、组织发布和集成共享服务。
技术介绍
在当今社会云计算、大数据、人工智能技术的飞速发展的背景下,各个领域产生了大量种类各异的数据资源,数据资源重要性被社会各界广泛认可,提升到国家重要的战略资源的层面。同时伴随着开放获取,数据共享需求的发展,越来越多的数据资源要求被开放共享使用。在国内外各种信息化工程建设的推动下,各种领域信息(数据)资源共享服务平台不断涌现。传统数据共享服务平台的数据资源共享大多组织成数据集形式提供共享,仅包括元数据和数据文件。对于结构化数据最常见存储方式—关系数据表多以表格文件(如excel,csv)形式提供服务,或者单纯的以数据表的形式提供共享,缺乏数据集成组织和元数据描述。重点存在的不足表现为:(1)无法实现(关系型、文件型)异构数据资源的统一共享服务,实体数据仅提供单一的文件形式。弱化了关系型结构化数据在线服务的优势,弱化了关系数据与文件数据关联融合服务的优势,弱化了关系型数据库表之间相互关联服务的优势。(2)传统的分布式数据汇聚、汇交以文件形式为主,不支持关系型数据的远程传输汇聚与同步管理。(3)缺乏一个通用可定制的异构数据汇聚传输、组织、发布与共享服务的一体化解决方法,过去的平台系统仅支持局限的某个或某些过程的服务子集,且多为根 ...
【技术保护点】
1.一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法,其特征在于,包括以下步骤:/n1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;/n2)分布端向中心端进行分布式异构数据的汇聚传输与同步;/n3)在中心端对汇聚的数据资源进行建库组织与编辑;/n4)在中心端对数据资源进行统一发布与审核;/n5)在中心端进行数据资源的集成共享服务。/n
【技术特征摘要】
20191119 CN 20191113574051.一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法,其特征在于,包括以下步骤:
1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;
2)分布端向中心端进行分布式异构数据的汇聚传输与同步;
3)在中心端对汇聚的数据资源进行建库组织与编辑;
4)在中心端对数据资源进行统一发布与审核;
5)在中心端进行数据资源的集成共享服务。
2.根据权利要求1所述的方法,其特征在于,所述数据节点注册实现分布端的数据节点信息及节点管理员认证信息的注册管理;
所述元数据扩展要素注册,支持扩展元数据项的定制化配置管理,元数据的配置项包括:元数据中文名、元数据英文名称、字段类型、是否必填项、是否重复、排序号、备注;
所述分类体系注册,支持树状数据分类体系的注册、编辑、删除操作,分类体系信息包括分类名称、分类代码、分类描述,用户能够对任意树状分类体系节点信息进行新增、编辑、插入和删除操作;
所述许可协议注册,支持标准的许可协议,同时支持自定义许可内容的注册、编辑、删除操作,注册信息包括协议标识码、协议名称、协议标识图片、协议说明文本。
3.根据权利要求2所述的方法,其特征在于,所述数据节点注册,其中数据节点的属性信息包括:数据节点名称、节点代码、节点简介、节点联系人、联系电话、Email、节点管理员账号、节点管理员密码、数据节点创建时间、序号;其中节点管理员账号、节点管理员密码供分布端执行步骤2)时进行节点管理员的身份认证;所述元数据扩展要素注册,包括以下元数据要素:数据集唯一持久标识、数据集封面、数据集名称、数据集简介、关键词、分类编码、开始时间、结束时间、创建机构、创建人员、最新创建/更新日期、发布机构、联系邮件、联系电话、最新发布日期、许可协议、引用格式、总存储量、总文件数、总记录数。
4.根据权利要求1所述的方法,其特征在于,所述分布式异构数据的汇聚传输与同步,包括:
2.1)进行异构数据源注册,包括关系型数据源和文件型数据源的统一注册连接管理;
2.2)进行数据传输任务构建,包括关系型数据任务构建和文件型数据任务构建;
2.3)进行传输任务运行管理,将分布端的数据任务向中心端远程高效地稳定传输;
2.4)进行关系型数据同步管理,将分布端的传输任务中的关系表或逻辑表中的每条记录定时同步到中心端的关系库表中。
5.根据权利要求3所述的方法,其特征在于,步骤2.2)所述关系型数据任务构建,是通过连接前文描述关系数据源获取相关数据表,选择相关实体数据表或通过SQL形成的逻辑数据表形成数据传输任务;所述文件型数据任务构建,是通过连接前文描述文件数据源确定相关文件目录体系,选择相关实体文件或目录,并选择中心端目标传输目录位置形成文件型数据传输任务。
6.根据权利要求3所述的方法,其特征在于,步骤2.3)所述传输任务运行管理,包括:实体数据文件传输基于中心端的Vftp服务采用FTP协议,支持与第三方FTP工具的完全兼容;在关系型实体数据传输方面,基于中心端构建的某类关系数据库集群,将分布端不同类型...
【专利技术属性】
技术研发人员:刘峰,周园春,韩芳,沈志宏,夏景隆,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。