【技术实现步骤摘要】
一种医疗流式数据血缘关系分析、存储方法及装置
本专利技术涉及到一种医疗流式数据血缘关系分析、存储方法及装置。
技术介绍
早期,医疗数据以医院内部HIS(医院信息系统)、PACS(医学影像存档与通讯系统)、LIS(实验室信息管理系统)三大系统的数据为核心,随着互联互通的深入,医院的应用系统越来越多,日产生的数据量成指数级上升,数据关系的复杂度也在不断上升,医疗数据采集面临着以下几类问题:医疗数据结构复杂,海量、散落在不同的信息系统、医疗数据分析方法不完善、缺乏统一的数据模型。同时,医疗监管部门对医院数据的监控、分析、决策的需求也在不断变化,业务标准也在不断的演进,对数据实时性、准确性要求越来越高,通过“定期ETL抽取N+1天的结构化数据再加工存储的方式”已经满足不了医疗监管业务的需要。为了解决数据及时性的问题,流式数据(流数据,又可被称为实时数据)上报系统可以快速地统计上报数据,并计算监管指标。但是,针对流式数据的关联关系建模和流式数据的标准化(结构化)保存过程,存在非常大的处理难度。比如,数据标准的变化,数据建模过程是否能快速的调整;医院业务系统的流式数据到达存储系统,存在时间上的差异,需要一套完善的架构保障数据的一致性和完整性;医疗异构系统的流式数据之间的关联关系种类繁多,且存在较多不确定性,全部依靠人工分析几乎无法完成。流式数据是一套有顺序、快速、量大、连续到达的数据序列,通常情况下,流式数据是可以被视为随时间延续而无限递增的一个动态数据集合,医疗业务(包括门急诊、检查检验、住院、缴费等业务)的有序性和流式数据到 ...
【技术保护点】
1.一种医疗流式数据血缘关系分析方法,其特征在于,包括以下步骤:/n第一步、针对标准化处理后的医疗流式数据进行语义分析,解析其中的业务字段,将业务字段作为目标字段;/n第二步、依据标准化处理后的医疗流式数据中包含的逻辑关系迭代拆分解析目标字段的血缘关系,包括与之对应的表依赖关系和字段依赖关系;/n第三步、将拆解得到的表依赖关系和字段依赖关系存入血缘关系模型。/n
【技术特征摘要】
1.一种医疗流式数据血缘关系分析方法,其特征在于,包括以下步骤:
第一步、针对标准化处理后的医疗流式数据进行语义分析,解析其中的业务字段,将业务字段作为目标字段;
第二步、依据标准化处理后的医疗流式数据中包含的逻辑关系迭代拆分解析目标字段的血缘关系,包括与之对应的表依赖关系和字段依赖关系;
第三步、将拆解得到的表依赖关系和字段依赖关系存入血缘关系模型。
2.一种医疗流式数据存储方法,其特征在于,包括以下步骤:
步骤1、对采集到的医疗流式数据进行标准化处理;
步骤2、在血缘关系模型中通过比对检索医疗流式数据的血缘关系;根据医疗流式数据的血缘关系,将其标准处理化后的数据保存到标准库中;其中血缘关系模型是指根据权利要求1所述的方法获得的血缘关系模型。
3.根据权利要求2所述的医疗流式数据存储方法,其特征在于,医疗流式数据的采集过程为:
SparkStreaming中的Job程序启动时,首先会初始化获取血缘关系模型,通过Spark广播机制将血缘关系模型分发至各采集医疗流式数据的服务器节点;
通过哈希取模算法将每条医疗流式数据的采集任务分配至医疗业务系统中各个采集医疗流式数据的服务器节点;每个采集医疗流式数据的服务器节点,对分配给其的医疗流式数据采集任务,根据血缘关系模型中相应医疗流式数据对应的血缘关系,完成相应医疗流式数据的独立采集;然后,各采集医疗流式数据的服务器节点把采集完成的医疗流式数据按照相应业务的业务逻辑进行封装,然后发送至Kafka集群中,最后由SparkStreaming从Kafka集群中获取医疗流式数据。
4.根据权利要求3所述的医疗流式数据存储方法,其特征在于,SparkStreaming每接获取一条医疗流式数据,就会对其进行标准化处理,然后依据血缘关系模型中该医疗流式数据对应的血缘关系,对该医疗流式数据进行血缘关系溯源,解析出该医疗流式数据整体的血缘关系;
SparkStreaming解析完医疗流式数据整体的血缘关系后,针对当前的医疗流式数据,基于其整体的血缘关系自动匹配属于其的家族数据,得到一条完整的数据脉,最后进行数据的持久化,即按以下两种情况递归判断血缘关系并进行结构化存储:
情况一、父表的数据到达,则将相应数据存入标准库,并触发通知子表进行存储动作,子表依次递归将相应数据从缓存库取出存储到标准库中;
情况二、子表的数据到达,依据血缘关系...
【专利技术属性】
技术研发人员:唐文亮,郭涛,宋渴可,
申请(专利权)人:湖南长城医疗科技有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。