一种基于电子病历应用的数据治理质量检测方法技术

技术编号:21895833 阅读:25 留言:0更新日期:2019-08-17 16:04
本发明专利技术公开了一种基于电子病历应用的数据治理质量检测方法,属于医疗数据应用技术领域。本发明专利技术的基于电子病历应用的数据治理质量检测方法,通过覆盖度检测、关联性检测、构成分析和映射分析完成数据治理质量的检测,所述覆盖度检测包括数量维度检测和时间维度检测;构成分析包括综合性指标和具体业务指标;映射分析包括基础字典映射指标和疾病、手术代码映射指标。该发明专利技术的基于电子病历应用的数据治理质量检测方法能够提升数据治理检测的全面性及可信度,具有很好的推广应用价值。

A Method of Data Governance Quality Detection Based on Electronic Medical Record Application

【技术实现步骤摘要】
一种基于电子病历应用的数据治理质量检测方法
本专利技术涉及医疗数据应用
,具体提供一种基于电子病历应用的数据治理质量检测方法。
技术介绍
医疗数据通过医院信息系统产生,医院信息系统的构成非常复杂,后台数据表少则几百个,多则上千个,电子病历系统属于其中一个非常重要的系统。在实际的医疗数据应用场景中有很多表及信息是冗余且没有价值的,因此医疗数据应用的基础便是对医疗数据进行数据治理。当前数据治理的方法首先是面向数据应用场景建立各种数据模型,然后通过在数据库层提取、清洗、整合原始数据并将数据加载至新模型中,数据治理质量的检测在此过程中显得尤为重要。然而数据治理质量检测目前没有系统的方法,现在常见的处理手段是针对具体的数据模型比对治理前后的数据量变化。虽然此方法可以从一定程度上反映数据治理的质量情况,但是其反映的问题非常片面而且也有很多的不适用性。比如新的数据模型很多情况下跟原始表并不是一一对应的关系,而且此方法也没有涉及对于治理内容的质量情况的检测。
技术实现思路
本专利技术的技术任务是针对上述存在的问题,提供一种能够提升数据治理检测的全面性及可信度的基于电子病历应用的数据治理质量检测方法。本专利技术进一步的技术任务是提供一种数据治理质量综合评估模型。为实现上述目的,本专利技术提供了如下技术方案:一种基于电子病历应用的数据治理质量检测方法,该方法从覆盖度检测、关联性检测、构成分析和映射分析四个方面进行数据治理质量的检测,并在最后通过综合的数据质量计算模型将数据质量定量表示。作为优选,所述覆盖度检测包括数量维度检测和时间维度检测。作为优选,所述数量维度检测包括基于传统方法提出的针对单表的数据量指标检测和基于业务综合指标的质量检测,其中针对单表的数据量指标检测适用于治理后数据模型的数据只来自于原数据的一个表,根据计算原表与治理后模型的数据量差异来判断。作为优选,所述时间维度检测包括时间范围检测和分段检测,时间范围检测是确定每个模型业务数据的起止时间与原始数据时间范围是否一致。作为优选,所述关联性检测为满足需要多个模型间关联查询应用的场景,分别计算对比原始数据中可以关联起来的数据量和治理完成的模型间可以正确关联的数据量。作为优选,所述构成分析为结合业务特性,选取重要的内容进行占比分析,确认数据的准确性,构成分析的指标可以是综合性指标,也可以结合每个数据模型单独设计具体业务指标。作为优选,所述映射分析包括基础字典映射和疾病、手术标准集映射。作为优选,所述基础字典映射指标首先需要计算每个字典的码值与名称是否一一对应,再进一步计算每个字典项在对应业务表中的占比情况来补充构成分析的内容。一种数据治理质量综合评估模型,该评估模型基于所述的覆盖度检测、关联性检测、构成分析和映射分析,该模型最终输出一个定量的值来作为统一的质量评估标准。该评估模型中引入了λi作为平衡因子来调节覆盖度检测、关联性检测、构成分析和映射分析的占比情况,λi取值及其参数之间的关系表示如下:与现有技术相比,本专利技术的基于电子病历应用的数据治理质量检测方法具有以下突出的有益效果:所述基于电子病历应用的数据治理质量检测方法首先通过覆盖度检测、关联性检测、构成分析、映射分析四方面的检测对数据治理质量进行了全面的评估,最后又通过治理评估模型给出了定量的质量情况参考值,在整个过程中通过对数据量跟业务指标多角度的检测分析,给出了全面的数据治理质量评估标准,具有良好的推广应用价值。附图说明图1是本专利技术所述基于电子病历应用的数据治理质量检测方法的流程图。具体实施方式下面将结合附图和实施例,对本专利技术的基于电子病历应用的数据治理质量检测方法作进一步详细说明。实施例如图1所示,本专利技术的基于电子病历应用的数据治理质量检测方法,该方法从覆盖度检测、关联性检测、构成分析和映射分析四个方面进行数据治理质量的检测。1、覆盖度检测覆盖度检测主要包含了数量维度检测及时间维度检测。数量维度检测可通过数据留存比指标C1来进行表示,数据留存比越接近1表示数据治理质量越高。在处理基于业务综合指标的质量检测的方法中,我们根据医院数据的业务特性,分别设计了医院就诊量、就诊人数、及就诊费用三个指标进行判断。本方明通过指标覆盖比指标C2进行表示,指标覆盖比越接近1表示数据治理质量越高。以就诊量比的计算为例说明如下:指标覆盖比指标C2根据就诊量比、就诊人数比及就诊费用比三个指标计算得到:时间维度检测可通过时间范围比指标C3进行表示,计算过程中需要使用到时间跨度的概念,即一个表的业务时间所跨的天数,具体计算公式表示如下:时间维度检测也可以在上面提到的数量维度检测的基础上细化成年份或者月份进行更详细维度的统计。比如对于数据留存比指标C1,可以细分为近3年每一年的数据留存比计数。2、关联性检测针对电子病历的应用场景我们分别提出了就诊-诊断比R1、就诊-药物比R2、就诊-费用比R3、就诊-检验比R4这4个关键性指标进行数据治理质量的关联性检测。以就诊-诊断比指标R1为例说明如下:此处需要注意的是电子病历中会存在多个就诊记录表及诊断表,比如住院部分会存在入院记录跟入院诊断、出院记录跟出院诊断、病案首页跟病案首页诊断等,在套用上面公式时可以计算就诊记录跟诊断表的整体情况,也可以分开进行计算,最后再进行求和平均。3、构成性分析
技术实现思路
中提到构成分析的指标可以是综合性指标,也可以结合每个数据模型单独设计具体业务指标,比如在费用构成中,我们可以分别计算门诊跟住院费用的占比指标F1。再比如对诊断模型而言,我们可以分别在原始数据和治理模型中按照就诊量计算排名前10疾病的占比指标F2,最后基于以上占比情况进行差异性比较。本专利技术以综合性指标门诊跟住院费用的占比F1为例说明如下:4、映射分析在映射分析阶段结合性别这个字典,首先判断原始表跟治理模型中是否都是包含相同的字典项(比如男性、女性)以及字典项码值是否一致(比如1代表男性,2代表女性),然后结合门诊表可以给出具体的性别就诊分析指标M1。而对于疾病、手术标准集更多的直接检测医院的疾病或者手术代码同ICD9及ICD10之间的对应情况,一是计算有多少可以完成对应,二是判断对应情况是否准确。本专利技术以别就诊分析指标M1为例进行说明:首先分别计算字典项一致比M11跟字典项占比M12:性别就诊分析指标M1结合字典项一致比M11跟字典项占比M12可表示为:性别就诊分析指标M1=字典项一致比M11*字典项占比M12数据治理质量综合评估模型最终输出一个定量的值来作为统一的质量评估标准,该评估模型中引入了λi作为平衡因子来调节覆盖度检测、关联性检测、构成分析和映射分析的占比情况,λi取值及其参数之间的关系可表示如下:平衡因子在结合覆盖度检测C、关联性检测R、构成分析F、映射分析M四方面的内容之后,可将数据治理质量综合评估模型的计算公式表示如下:其中n1、n2、n3、n4分别代表了四项检测内容中质量指标的数量。Ci、Ri、Fi、Mi则代表了对应每项检测内容的具体指标项。以上所述的实施例,只是本专利技术较优选的具体实施方式,本领域的技术人员在本专利技术技术方案范围内进行的通常变化和替换都应包含在本专利技术的保护范围内。本文档来自技高网
...

【技术保护点】
1.一种基于电子病历应用的数据治理质量检测方法,其特征在于:该方法从覆盖度检测、关联性检测、构成分析和映射分析四个方面进行数据治理质量的检测,并在最后通过综合的数据质量计算模型将数据质量定量表示。

【技术特征摘要】
1.一种基于电子病历应用的数据治理质量检测方法,其特征在于:该方法从覆盖度检测、关联性检测、构成分析和映射分析四个方面进行数据治理质量的检测,并在最后通过综合的数据质量计算模型将数据质量定量表示。2.根据权利要求1所述的基于电子病历应用的数据治理质量检测方法,其特征在于:所述覆盖度检测包括数量维度检测和时间维度检测。3.根据权利要求2所述的基于电子病历应用的数据治理质量检测方法,其特征在于:所述数量维度检测包括基于传统方法提出的针对单表的数据量指标检测和基于业务综合指标的质量检测,其中针对单表的数据量指标检测适用于治理后数据模型的数据只来自于原数据的一个表,根据计算原表与治理后模型的数据量差异来判断。4.根据权利要求3所述的基于电子病历应用的数据治理质量检测方法,其特征在于:所述时间维度检测包括时间范围检测和分段检测,时间范围检测是确定每个模型业务数据的起止时间与原始数据时间范围是否一致。5.根据权利要求4所述的基于电子病历应用的数据治理质量检测方法,其特征在于:所述关联性检测...

【专利技术属性】
技术研发人员:王庚朱玉河石兴磊高传贵
申请(专利权)人:浪潮软件集团有限公司山东健康医疗大数据有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1