一种医疗流式数据血缘关系分析、存储方法及装置制造方法及图纸

技术编号：25525716 阅读：68 留言：0更新日期：2020-09-04 17:14

本发明专利技术提出了一种医疗流式数据血缘关系分析、存储方法及装置，所述血缘关系分析方法为：针对标准处理化后的医疗流式数据，进行语义分析，解析其中的业务字段作为目标字段；再迭代拆分解析目标字段的血缘关系，得到与之对应的表依赖关系和字段依赖关系；最后将拆解得到的表依赖关系和字段依赖关系存入血缘关系模型，并将血缘关系模型存储到血缘库。基于自学习过程，利用标准库存储的数据验证血缘库中血缘关系模型的正确性，并及时更新血缘关系模型。本发明专利技术能够正确分析出医疗流式数据之间的血缘关系，并基于血缘关系自动完成大批量医疗流式数据的结构化存储。

全部详细技术资料下载

【技术实现步骤摘要】
一种医疗流式数据血缘关系分析、存储方法及装置
本专利技术涉及到一种医疗流式数据血缘关系分析、存储方法及装置。
技术介绍
早期，医疗数据以医院内部HIS(医院信息系统)、PACS(医学影像存档与通讯系统)、LIS(实验室信息管理系统)三大系统的数据为核心，随着互联互通的深入，医院的应用系统越来越多，日产生的数据量成指数级上升，数据关系的复杂度也在不断上升，医疗数据采集面临着以下几类问题：医疗数据结构复杂，海量、散落在不同的信息系统、医疗数据分析方法不完善、缺乏统一的数据模型。同时，医疗监管部门对医院数据的监控、分析、决策的需求也在不断变化，业务标准也在不断的演进，对数据实时性、准确性要求越来越高，通过“定期ETL抽取N+1天的结构化数据再加工存储的方式”已经满足不了医疗监管业务的需要。为了解决数据及时性的问题，流式数据(流数据，又可被称为实时数据)上报系统可以快速地统计上报数据，并计算监管指标。但是，针对流式数据的关联关系建模和流式数据的标准化(结构化)保存过程，存在非常大的处理难度。比如，数据标准的变化，数据建模过程是否能快...

【技术保护点】
1.一种医疗流式数据血缘关系分析方法，其特征在于，包括以下步骤：/n第一步、针对标准化处理后的医疗流式数据进行语义分析，解析其中的业务字段，将业务字段作为目标字段；/n第二步、依据标准化处理后的医疗流式数据中包含的逻辑关系迭代拆分解析目标字段的血缘关系，包括与之对应的表依赖关系和字段依赖关系；/n第三步、将拆解得到的表依赖关系和字段依赖关系存入血缘关系模型。/n

【技术特征摘要】
1.一种医疗流式数据血缘关系分析方法，其特征在于，包括以下步骤：
第一步、针对标准化处理后的医疗流式数据进行语义分析，解析其中的业务字段，将业务字段作为目标字段；
第二步、依据标准化处理后的医疗流式数据中包含的逻辑关系迭代拆分解析目标字段的血缘关系，包括与之对应的表依赖关系和字段依赖关系；
第三步、将拆解得到的表依赖关系和字段依赖关系存入血缘关系模型。

2.一种医疗流式数据存储方法，其特征在于，包括以下步骤：
步骤1、对采集到的医疗流式数据进行标准化处理；
步骤2、在血缘关系模型中通过比对检索医疗流式数据的血缘关系；根据医疗流式数据的血缘关系，将其标准处理化后的数据保存到标准库中；其中血缘关系模型是指根据权利要求1所述的方法获得的血缘关系模型。

3.根据权利要求2所述的医疗流式数据存储方法，其特征在于，医疗流式数据的采集过程为：
SparkStreaming中的Job程序启动时，首先会初始化获取血缘关系模型，通过Spark广播机制将血缘关系模型分发至各采集医疗流式数据的服务器节点；
通过哈希取模算法将每条医疗流式数据的采集任务分配至医疗业务系统中各个采集医疗流式数据的服务器节点；每个采集医疗流式数据的服务器节点，对分配给其的医疗流式数据采集任务，根据血缘关系模型中相应医疗流式数据对应的血缘关系，完成相应医疗流式数据的独立采集；然后，各采集医疗流式数据的服务器节点把采集完成的医疗流式数据按照相应业务的业务逻辑进行封装，然后发送至Kafka集群中，最后由SparkStreaming从Kafka集群中获取医疗流式数据。

4.根据权利要求3所述的医疗流式数据存储方法，其特征在于，SparkStreaming每接获取一条医疗流式数据，就会对其进行标准化处理，然后依据血缘关系模型中该医疗流式数据对应的血缘关系，对该医疗流式数据进行血缘关系溯源，解析出该医疗流式数据整体的血缘关系；
SparkStreaming解析完医疗流式数据整体的血缘关系后，针对当前的医疗流式数据，基于其整体的血缘关系自动匹配属于其的家族数据，得到一条完整的数据脉，最后进行数据的持久化，即按以下两种情况递归判断血缘关系并进行结构化存储：
情况一、父表的数据到达，则将相应数据存入标准库，并触发通知子表进行存储动作，子表依次递归将相应数据从缓存库取出存储到标准库中；
情况二、子表的数据到达，依据血缘关系...

【专利技术属性】
技术研发人员：唐文亮，郭涛，宋渴可，
申请(专利权)人：湖南长城医疗科技有限公司，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人