一种用于保证异构数据库系统中数据集成完整性的系统技术方案

技术编号:18367384 阅读:152 留言:0更新日期:2018-07-05 08:38
本发明专利技术涉及一种用于保证异构数据库系统中数据集成完整性的系统。该系统为了保证异构数据库系统中数据集成的完整性,而设计了一种集成数据层,为来自异构数据源的数据提供转换功能,满足数据完整性要求。

A system for ensuring the integrity of data integration in heterogeneous database systems

The invention relates to a system for ensuring the integrity of data integration in heterogeneous database systems. In order to ensure the integrity of data integration in heterogeneous database systems, an integrated data layer is designed to provide conversion functions for data from heterogeneous data sources to meet the requirements of data integrity.

【技术实现步骤摘要】
一种用于保证异构数据库系统中数据集成完整性的系统
本专利技术属于知识管理与数据集成

技术介绍
随着大数据时代的到来和知识经济的深入发展,企业、研究所等研发和生产机构愈发重视对知识的管理,实施了许多信息化软件,并产生了大量的数据,分别存储于不同的数据库中。而相对独立、缺乏组织的知识难以发挥充分的价值,因此需要通过对异构数据库的集成将这些资源进行有效的整合。这些数据库具有系统异构、结构异构等特点,称为异构数据库。常规的集成方法多采取定制的方式,对现有的异构数据库进行集成,且要求在集成之前,完成对这些数据库结构的读取工作,为后期构建检索语句提供基础,此步骤是实现集成方法的重要部分。而当用户提出新的需求时,则需要人工对平台进行维护和改进,是一个漫长而复杂的过程。当前也存在一些支持用户导入和管理数据库的集成方法,但是,这些集成方法只能够实现初步的集成,在集成检索中向用户返回最基本的检索字段,当用户对知识详细内容和结构有进一步需求时,往往采取自动获取数据库关联表的方式向用户返回一些可能相关的信息,而这些信息往往具有准确度低、缺乏组织等特点。而在异构数据源的集成过程中,存在保证异构数据库系统中数据集成完整性的要求,其是指某一节点发生数据变化时,立即更新到其它节点,已保证任何时间任何节点的数据均保持完整。对于异构数据源,其对于相同数据的数据结构、数据模式可能存在不一致现象,因此他们对于数据的同步并非简单的“转存”,这时就需要建立合理的机制来保证数据在异构数据源中的完整,而避免冲突。因此,在本领域中,如何保证来自异构数据源的数据集成的完整性,而避免异构数据的冲突是需要解决的技术问题。
技术实现思路
为了解决现有技术中的上述问题,本专利技术提出了一种用于保证异构数据库系统中数据集成完整性的系统。本专利技术采用的技术方案如下:一种用于保证异构数据库系统中数据集成完整性的系统,包括:所述异构数据库系统包括数据仓库、集成数据层和应用接口;底层的各个异构数据源构成了系统的数据仓库;集成数据层封装了异构数据库集成系统的业务逻辑;各种应用程序和对应的访问接口构成了系统的应用接口;集成数据层是实现异构数据库中数据转换的核心,目的是访问各个数据源,集成数据源信息,协调各数据源间信息;集成数据层在各局部数据提供的共享数据的基础之上建立一个全局的虚拟视图,并不存储实际的数据;具体包括:元数据DB、元数据管理器、封装器、切换器、应用层访问统一接口、异构数据源归一化接口;元数据DB用于储存各异构数据库的元数据库信息;元数据管理器用于制定集成系统的全局模式与局部数据库的模式之间的转换规则;切换器用于异构数据库的注册、公共模型的生成和全局查询请求的接收;封装器用于实现数据位置和访问的透明,对异构的数据进行包装;集成数据层对外提供了两个统一接口,即应用层访问统一接口和底层异构数据库访问接口;其功能是屏蔽各数据库的差异,提供数据的透明访问,使得使用者无需知道数据的数据源模式及具体的物理位置等信息,只需通过系统定义的与具体数据源无关的SQL语句进行访问;当应用开始运行后,首先需要读取基础配置,该配置信息来源于元数据DB,包括储存各异构数据源的元数据库信息;连接多个数据源,其中包括主数据源A和至少一个数据源B,通过底层异构数据库访问接口捕获数据源B中的数据变化,如果没有新的数据变化,则线程进入等待状态,等待时间过后则开始新的循环;如果有新的数据变化则读取出数据,然后按照指定的传输协议格式,进行数据格式变化;将所述全局模式分别反馈给数据源A和数据源B,并由数据源A和数据源B根据所述数据完整性要求,重新组织将要集成的数据;汇总所有分支数据源的数据变化,将其反映到局部数据源的模式中,并最终由元数据管理器集成到全局数据模式中,以及将获取的数据存储数据缓存;连接主数据源A,根据局部数据源的模式变化所产生的对应的主数据源的模式,将数据格式变化结果同步至主数据源。优选地,其中,切换器由三个组件构成,包括:异构数据注册模块、查询规划模块和结果合并过滤模块;异构数据注册模块的主要功能是:在共享数据注册阶段,负责公共模型的建立以及异构数据库的共享注册;查询规划模块的主要功能是:在数据集成阶段,将客户端提交的基于全局数据库的标准查询分解成针对各个异构数据库的子查询,并提交到相应的包装器;结果合并过滤模块的主要功能是:将各异构数据库查询返回的XML文档进行合并,形成完整统一的查询结果,反馈至客户端浏览器。优选地,其中,封装器由智能更新模块、查询结果转换模块和数据库操作模块三个组件构成;智能更新模块采用spring框架的quartz任务定时的扫描由不同的异构数据库上传的XML描述文档,通过解析这些XML文档,实现数据自动更新;查询结果转换模块负责将SQL查询的结果转换为XML文档;数据库操作模块负责连接后台各个异构数据库,包括初始化数据库连接、分配连接、封装数据库基本操作、关闭连接的功能。本专利技术的有益效果包括:在异构数据源集成体系结构中保证了异构数据源数据集成的完整性,而不影响现有的异构数据源集成模式。【附图说明】此处所说明的附图是用来提供对本专利技术的进一步理解,构成本申请的一部分,但并不构成对本专利技术的不当限定,在附图中:图1是本专利技术中异构数据库智能集成系统框架图;图2是本专利技术方法的流程图。【具体实施方式】下面将结合附图以及具体实施例来详细说明本专利技术,其中的示意性实施例以及说明仅用来解释本专利技术,但并不作为对本专利技术的限定。参见附图1,Web服务集成中间件系统体系自下而上包括数据仓库、集成数据层和应用接口。其中,底层的各个异构数据源构成了系统的数据仓库;集成数据层采用中间件技术,封装了异构数据库集成系统的业务逻辑;各种应用程序和对应的访问接口构成了系统的应用接口。该系统采用B/S模式,构成了客户/服务器三层架构。采用这种设计有以下几种优势:安装升级方便;易扩展维护;可移植性强可靠性强;数据智能更新快。集成数据层是实现异构数据库中数据转换的核心,目的是访问各个数据源,集成数据源信息,协调各数据源间信息。集成数据层在各局部数据提供的共享数据的基础之上建立一个全局的虚拟视图,并不存储实际的数据。具体包括:元数据DB、元数据管理器、封装器、切换器、应用层访问统一接口、异构数据源归一化接口,下面分别对各模块加以介绍。元数据DB负责储存各异构数据库的元数据库信息。元数据库信息包括注册信息、连接信息URL、各元数据库用户与全局用户的匹配关系、模式映射信息、访问策略信息等。元数据DB支撑整个系统的运行。元数据管理器负责制定集成系统的全局模式与局部数据库的模式之间的转换规则。切换器负责异构数据库的注册、公共模型的生成和全局查询请求的接收。切换器由三个组件构成,包括:异构数据注册模块、查询规划模块和结果合并过滤模块。其中,异构数据注册模块的主要功能是:在共享数据注册阶段,负责公共模型的建立以及异构数据库的共享注册;查询规划模块的主要功能是:在数据集成阶段,将客户端提交的基于全局数据库的标准查询分解成针对各个异构数据库的子查询,并提交到相应的包装器;结果合并过滤模块的主要功能是:将各异构数据库查询返回的XML文档进行合并,形成完整统一的查询结果,反馈至客户端浏览器。封装器的功能是实现数据位本文档来自技高网
...
一种用于保证异构数据库系统中数据集成完整性的系统

【技术保护点】
1.一种用于保证异构数据库系统中数据集成完整性的系统,所述异构数据库系统包括数据仓库、集成数据层和应用接口;底层的各个异构数据源构成了系统的数据仓库;集成数据层封装了异构数据库集成系统的业务逻辑;各种应用程序和对应的访问接口构成了系统的应用接口;集成数据层是实现异构数据库中数据转换的核心,目的是访问各个数据源,集成数据源信息,协调各数据源间信息;集成数据层在各局部数据提供的共享数据的基础之上建立一个全局的虚拟视图,并不存储实际的数据;具体包括:元数据DB、元数据管理器、封装器、切换器、应用层访问统一接口、异构数据源归一化接口;元数据DB用于储存各异构数据库的元数据库信息;元数据管理器用于制定集成系统的全局模式与局部数据库的模式之间的转换规则;切换器用于异构数据库的注册、公共模型的生成和全局查询请求的接收;封装器用于实现数据位置和访问的透明,对异构的数据进行包装;集成数据层对外提供了两个统一接口,即应用层访问统一接口和底层异构数据库访问接口;其功能是屏蔽各数据库的差异,提供数据的透明访问,使得使用者无需知道数据的数据源模式及具体的物理位置等信息,只需通过系统定义的与具体数据源无关的SQL语句进行访问;当应用开始运行后,首先需要读取基础配置,该配置信息来源于元数据DB,包括储存各异构数据源的元数据库信息;连接多个数据源,其中包括主数据源A和至少一个数据源B,通过底层异构数据库访问接口捕获数据源B中的数据变化,如果没有新的数据变化,则线程进入等待状态,等待时间过后则开始新的循环;如果有新的数据变化则读取出数据,然后按照指定的传输协议格式,进行数据格式变化;将所述全局模式分别反馈给数据源A和数据源B,并由数据源A和数据源B根据所述数据完整性要求,重新组织将要集成的数据;汇总所有分支数据源的数据变化,将其反映到局部数据源的模式中,并最终由元数据管理器集成到全局数据模式中,以及将获取的数据存储数据缓存;连接主数据源A,根据局部数据源的模式变化所产生的对应的主数据源的模式,将数据格式变化结果同步至主数据源。...

【技术特征摘要】
1.一种用于保证异构数据库系统中数据集成完整性的系统,所述异构数据库系统包括数据仓库、集成数据层和应用接口;底层的各个异构数据源构成了系统的数据仓库;集成数据层封装了异构数据库集成系统的业务逻辑;各种应用程序和对应的访问接口构成了系统的应用接口;集成数据层是实现异构数据库中数据转换的核心,目的是访问各个数据源,集成数据源信息,协调各数据源间信息;集成数据层在各局部数据提供的共享数据的基础之上建立一个全局的虚拟视图,并不存储实际的数据;具体包括:元数据DB、元数据管理器、封装器、切换器、应用层访问统一接口、异构数据源归一化接口;元数据DB用于储存各异构数据库的元数据库信息;元数据管理器用于制定集成系统的全局模式与局部数据库的模式之间的转换规则;切换器用于异构数据库的注册、公共模型的生成和全局查询请求的接收;封装器用于实现数据位置和访问的透明,对异构的数据进行包装;集成数据层对外提供了两个统一接口,即应用层访问统一接口和底层异构数据库访问接口;其功能是屏蔽各数据库的差异,提供数据的透明访问,使得使用者无需知道数据的数据源模式及具体的物理位置等信息,只需通过系统定义的与具体数据源无关的SQL语句进行访问;当应用开始运行后,首先需要读取基础配置,该配置信息来源于元数据DB,包括储存各异构数据源的元数据库信息;连接多个数据源,其中包括主数据源A和至少一个数据源B,通过底层异构数据库访问接口捕获数据源B中的数据变化,如果没有新的数据变化,则线程进入等待状态,等待时间过后则开始新的循环;如果...

【专利技术属性】
技术研发人员:林殷吴方才朱雪松
申请(专利权)人:航天星图科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1