一种医疗数据的迁移方法和装置制造方法及图纸

技术编号:15791949 阅读:475 留言:0更新日期:2017-07-09 22:43
本发明专利技术实施例公开了一种医疗数据的迁移方法和装置,该方法可以包括:解析待迁移数据库,获取所述待迁移数据库的主键关系与外键关系;根据所述待迁移数据库的主键关系与外键关系构建关系型的数据单元;根据所述数据单元的大小,通过分布式并行计算将所述数据单元迁移至分布式数据库HBase。本发明专利技术实施例提供的医疗数据的迁移方法和装置能够将多态异构的医疗数据完整、一致且低延迟地迁移到分布式数据库中。

【技术实现步骤摘要】
一种医疗数据的迁移方法和装置
本专利技术涉及数据库
,尤其涉及一种医疗数据的迁移方法和装置。
技术介绍
医疗数据是所有与医疗和生命健康相关以及患者在医疗照护的各阶段所产生的数据的集合,由于医疗数据的类型复杂,来源多样,因此医疗数据的异构度较高。但是医疗数据中蕴含着多样且丰富的信息价值,有效地将医疗数据进行整合对医生、医院、医疗研究机构、保健中心及患者都具有显著的优点。当前医疗数据的存储是基于关系型数据库和非关系型数据库(NoSQL,NotOnlySQL)MongoDB实现的,但是上述数据库类型在应对与海量大数据相关的业务时具有明显的劣势,比如面对海量数据的高效存储和访问需求,当前医疗数据的存储方案具有存储记录数量有限、SQL查询效率低的弱点;面对高并发读写的需求,当前医疗数据的存储方案会出现数据库读写压力巨大,硬盘IO无法承受的问题;并且关系型数据库的建表方法及表结构特点使得数据库横向扩展艰难,无法通过快速增加服务器节点实现,同时,数据库系统的维护和升级过程将会造成服务的不可用,无法满足高可扩展性和高可用性的需求。针对当前医疗数据的存储方案的诸多问题,可以通过Hadoop数据库HBase来替代原有的关系型数据库和MongoDB。但是,由于医疗数据类型复杂,来源多样、异构度高,因此,如何将多态异构的医疗数据在完整性、一致性、低延迟的情况下迁移到HBase,是目前的主要问题。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种医疗数据的迁移方法和装置,能够将多态异构的医疗数据完整、一致且低延迟地迁移到分布式数据库中。本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种医疗数据的迁移方法,所述方法包括:解析待迁移数据库,获取所述待迁移数据库的主键关系与外键关系;根据所述待迁移数据库的主键关系与外键关系构建关系型的数据单元;其中,所述数据单元为具有层级关系的数据集;根据所述数据单元的大小,通过分布式并行计算将所述数据单元迁移至分布式数据库HBase。在上述方案中,在将所述数据单元迁移至所述HBase的过程中,所述方法还包括:建立医疗数据中的临床路径与所述数据单元之间的第一映射关系;其中,所述临床路径包括至少一个路径节点,每个路径节点为至少一个多源异构数据的集合;根据第一映射关系建立第一本体数据库。在上述方案中,所述方法还包括:根据所述第一映射关系为所述第一本体数据库设置对应的第一入库接口。在上述方案中,在将所述数据单元迁移至所述HBase的过程中,所述方法还包括:建立用户信息与所述数据单元之间的第二映射关系;其中,所述用户信息包括用户标识;根据所述第二映射关系建立第二本体数据库。在上述方案中,所述方法还包括:根据所述第二映射关系设置所述第二本体数据库的入库接口。第二方面,本专利技术实施例提供了一种医疗数据的迁移装置,所述装置包括:解析模块、构建模块和迁移模块;其中,所述解析模块,用于解析待迁移数据库,获取所述待迁移数据库的主键关系与外键关系;所述构建模块,用于根据所述待迁移数据库的主键关系与外键关系构建关系型的数据单元;其中,所述数据单元为具有层级关系的数据集;所述迁移模块,用于根据所述数据单元的大小,通过分布式并行计算将所述数据单元迁移至分布式数据库HBase。在上述方案中,所述装置还包括:第一建立模块,用于建立医疗数据中的临床路径与所述数据单元之间的第一映射关系;其中,所述临床路径包括至少一个路径节点,每个路径节点为至少一个多源异构数据的集合;以及,根据第一映射关系建立第一本体数据库。在上述方案中,所述装置还包括:第一设置模块,用于根据所述第一映射关系为所述第一本体数据库设置对应的第一入库接口。在上述方案中,所述装置还包括:第二建立模块,用于建立用户信息与所述数据单元之间的第二映射关系;其中,所述用户信息包括用户标识;以及,根据所述第二映射关系建立第二本体数据库。在上述方案中,所述装置还包括:第二设置模块,用于根据所述第二映射关系设置所述第二本体数据库的入库接口。本专利技术实施例提供了一种医疗数据的迁移方法和装置,根据待迁移数据库的主键关系和外键关系构建具有层级关系的关系型数据单元,并通过分布式并行计算将数据单元迁移至HBase,能够将多态异构的医疗数据完整、一致且低延迟地迁移到分布式数据库中。附图说明图1为本专利技术实施例提供的一种医疗数据的迁移方法流程示意图;图2为本专利技术实施例提供的一种医疗数据的迁移具体实施过程示意图;图3为本专利技术实施例提供的一种医疗数据的迁移装置结构示意图;图4为本专利技术实施例提供的另一种医疗数据的迁移装置结构示意图;图5为本专利技术实施例提供的又一种医疗数据的迁移装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例一如图1所示,其示出了本专利技术实施例提供的一种医疗数据的迁移方法,该方法可以应用于一数据迁移装置,该方法可以包括:S101:解析待迁移数据库,获取该待迁移数据库的主键关系与外键关系;S102:根据该待迁移数据库的主键关系与外键关系构建关系型的数据单元;其中,需要说明的是,该数据单元为具有层级关系的数据集;S103:根据数据单元的大小,通过分布式并行计算将数据单元迁移至HBase。需要说明的是,待迁移数据库可以来自于多种数据源,并且通过不同的数据结构进行存储的数据库,所以待迁移数据库具有多源异构的性质。数据源及存储数据结构的差异性通常会导致将这些数据库向HBase整合或者迁移时,造成数据库的表的丢失。因此,本实施例通过对待迁移数据库进行解析,从而提取待迁移数据库的主键以及外键关系,将具有层级关系连接的多个数据表进行结合,从而能够构建出数据单元,这个数据单元是关系型的,一个数据单元可以通过主键与外键关系将多个表进行存储,从而可以避免在构建数据单元过程中,造成某些有意义的数据表的遗漏,从而保证了迁移数据的完整性。其次,通过主键和外键关系对数据单元中的多个表建立联系,使得每个数据单元都具有自身的数据规律,从而在数据迁移完成后,当Hbase出现大量的抽取或组织操作时,能够提升后续相关的开发效率,也满足了对数据进行后续分析的要求。再次,由于数据单元是将具有层级关系连接的多个数据表进行结合而构建成的,因此,在通过分布式并行计算方法对数据单元进行迁移时,能够按照数据单元的大小一次性的进行迁移完毕。而按照现有的数据库迁移技术,如果一次性从甲骨文ORACLE数据库系统中迁移出100个表,那么ORACLE数据库系统由于内存和性能的限制,会出现数据库锁死的情况,从而不能实现整合,加大了数据迁移的时延。因此,将数据单元通过分布式并行计算方法一次性的进行迁移,不仅能够避免出现数据库锁死,而且一次性的将数据单元中的多个数据表完成迁移,减少了数据迁移的时延。对于图1所示的实施例,以ORACLE数据库为待迁移数据库为例,在具体的实施过程中,如图2所示:首先,数据整合引擎将由ORACLE数据库存储的不同数据源的医疗数据进行层次关系解析,例如数据整合引擎接收医院的医院信息系统(HospitalInformationSystem,HIS)、电子病例(ElectronicMedicalRecord,EMR)系统、试验信息系统本文档来自技高网...
一种医疗数据的迁移方法和装置

【技术保护点】
一种医疗数据的迁移方法,其特征在于,所述方法包括:解析待迁移数据库,获取所述待迁移数据库的主键关系与外键关系;根据所述待迁移数据库的主键关系与外键关系构建关系型的数据单元;其中,所述数据单元为具有层级关系的数据集;根据所述数据单元的大小,通过分布式并行计算将所述数据单元迁移至分布式数据库HBase。

【技术特征摘要】
1.一种医疗数据的迁移方法,其特征在于,所述方法包括:解析待迁移数据库,获取所述待迁移数据库的主键关系与外键关系;根据所述待迁移数据库的主键关系与外键关系构建关系型的数据单元;其中,所述数据单元为具有层级关系的数据集;根据所述数据单元的大小,通过分布式并行计算将所述数据单元迁移至分布式数据库HBase。2.根据权利要求1所述的方法,其特征在于,在将所述数据单元迁移至所述HBase的过程中,所述方法还包括:建立医疗数据中的临床路径与所述数据单元之间的第一映射关系;其中,所述临床路径包括至少一个路径节点,每个路径节点为至少一个多源异构数据的集合;根据第一映射关系建立第一本体数据库。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述第一映射关系为所述第一本体数据库设置对应的第一入库接口。4.根据权利要求1所述的方法,其特征在于,在将所述数据单元迁移至所述HBase的过程中,所述方法还包括:建立用户信息与所述数据单元之间的第二映射关系;其中,所述用户信息包括用户标识;根据所述第二映射关系建立第二本体数据库。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述第二映射关系设置所述第二本体数据库的入库接口。6.一种医疗数据的迁移装置,其特征在于,所...

【专利技术属性】
技术研发人员:常耀斌于路程龙龙张志鹏
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1