医疗数据存储的分区变更方法以及装置制造方法及图纸

技术编号:32015108 阅读:21 留言:0更新日期:2022-01-22 18:33
本申请实施例提供了一种医疗数据存储的分区变更方法以及装置,包括:获取当前时刻的新增医疗数据;若在预设索引数据库中查询到与该新增医疗数据的主键值相同的历史索引信息,且该新增医疗数据的分区键值与历史索引信息中的分区键值不相同,则从分布式文件系统中删除历史索引信息对应的历史医疗数据,并将该新增医疗数据写入第一目标文件后存储至分布式文件系统的第一目标分区;基于该新增医疗数据的分区键值、第一目标文件的标识信息以及第一目标分区的分区路径,更新该新增医疗数据在预设索引数据库中的历史索引信息得到第一当前索引信息。该方案高效的实现了分区变更操作,保证了分布式文件系统中存储的医疗数据的准确性。确性。确性。

【技术实现步骤摘要】
医疗数据存储的分区变更方法以及装置


[0001]本申请涉及计算机
,具体而言,本申请涉及一种医疗数据存储的分区变更方法以及装置。

技术介绍

[0002]大批量数据在HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)进行存储的场景下,可以对HDFS中的文件进行分区存储,即将数据分别存储在多个不同的目录下,以便于数据查询时根据分区目录进行快速检索。
[0003]对于医院的多个业务系统产生的大批量医疗数据,在将其按hudi模式存储至分布式文件系统时,也可以采用分区存储的方式,即按业务字段进行分区存储,然后在查询时通过对应的业务字段进行检索。例如,可以按医疗数据产生时间的区别,分别将数据存储至不同日期对应的目录,例如将2020年1月1日产生的医疗数据存储在分布式文件系统的“2020

01

01”目录上,在数据检索的时候,若想查询2020年1月1日产生的医疗数据,只需要检索“2020

01

01”目录即可查询到想本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种医疗数据存储的分区变更方法,其特征在于,包括:获取当前时刻的至少一个新增医疗数据;对于每一新增医疗数据,若在预设索引数据库中查询到与该新增医疗数据的主键值相同的历史索引信息,且该新增医疗数据的分区键值与所述历史索引信息中的分区键值不相同,则从分布式文件系统中删除所述历史索引信息对应的历史医疗数据,并将该新增医疗数据写入第一目标文件后存储至所述分布式文件系统的第一目标分区;基于该新增医疗数据的分区键值、所述第一目标文件的标识信息以及所述第一目标分区的分区路径,更新该新增医疗数据在所述预设索引数据库中的所述历史索引信息得到第一当前索引信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述分布式文件系统在所述当前时刻发生数据回滚,则从所述预设索引数据库中,获取从数据回滚到的时刻至所述当前时刻的至少一个当前索引信息,并获取所述数据回滚到的时刻之前的至少一个历史索引信息;对于每一当前索引信息,若所述至少一个历史索引信息中存在与该当前索引信息主键值相同的历史索引信息,则从所述预设索引数据库中删除该当前索引信息,并恢复与该当前索引信息的主键值相同的历史索引信息。3.根据权利要求2所述的方法,其特征在于,所述预设索引数据库为Hbase数据库,所述获取所述数据回滚到的时刻的至少一个历史索引数据,包括:获取所述Hbase数据库在所述当前时刻的版本,并获取所述Hbase数据库相对于所述当前时刻的版本的上一个版本;确定所述上一个版本的所述Hbase数据库中的至少一个索引信息为所述至少一个历史索引信息。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:对于每一当前索引信息,若所述至少一个历史索引数据中不存在与该当前索引信息主键值相同的历史索引信息,则从所述预设索引数据库中删除该当前索引信息。5.根据权利要求1所述的方法,其特征在于,所述获取当前时刻的至少一个新增医疗数据,包括:获取所述当前时刻的至少一个初始新增医疗数据;对于主键值相同的各初始新增医疗数据,保留产生时刻最新的初始新增医疗数据,并删除其他初始新增医疗数据,得到所述至少一个新增医疗数据。6.根据权利要求5所述的方法,其特征在于,所述初始新增医疗数据为未经去重处理的新增医疗数据。7.根据权利要求1所述的方法,其特征在于,所述从分布式文件系统中删除所述历史索引信息对应的历史医疗数据,并将该新增医疗数据写入第一目标...

【专利技术属性】
技术研发人员:秦晓宏黄主斌
申请(专利权)人:上海柯林布瑞信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1