一种数据质量评估方法及系统技术方案

技术编号:31496302 阅读:29 留言:0更新日期:2021-12-18 12:38
本申请公开了一种数据质量评估方法及系统。该方法首先提取待进行数据质量评估的医院数据库表元数据信息,补充完善该表的数据模型和显示模型;补充完善后将表信息添加到数据资产列表中;通过可维护的检查规则逐一对表对象中的列进行检查规则配置,一个列得到至少一个列检查视图;针对表可以设置多个表检查方案,通过对表检查方案的执行得到表的数据质量分数和列所属数据质量级别;最终,针对数据资产可以设置多个评估方案,不同的评估方案可以对应多个不同的表检查方案,通过对评估方案的执行得到本次评估数据质量分数和表所属数据质量级别。可以看出,通过本申请可以快速分析统计数据得到目标数据资产的数据质量评估报告。计数据得到目标数据资产的数据质量评估报告。计数据得到目标数据资产的数据质量评估报告。

【技术实现步骤摘要】
一种数据质量评估方法及系统


[0001]本专利技术涉及数据质量评估领域,特别涉及一种数据质量评估方法及系统。

技术介绍

[0002]信息化建设一般往往注重在业务功能和流程上,对数据的标准性方面没有关注,随着信息化建设的不断发展,国家卫计委对全国医院信息的可共享性要求越来越高,对数据标准越来越重视,最近五年陆续颁布一系列数据标准,并展开相关标准测评工作,要求医院的业务数据达到标准符合程度。另外一方面随着对数据利用的需求越来越高,数据一致性、数据标准型等问题往往阻碍了数据的利用。
[0003]医院要想提高数据标准符合程度,首先需要了解现有数据与标准有多大的距离,基本上只能通过手工写sql语句实现,而且还有很多疏漏,也不好统计,效率很低。

技术实现思路

[0004]基于此,本申请实施例提供了一种数据质量评估方法及系统,提高了数据的质量以及获取数据的效率。
[0005]第一方面,提供了一种数据质量评估方法,该方法包括:
[0006]提取待进行数据质量评估的医院数据库表元数据信息,补充完善该表的数据模型和显示模型;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据质量评估方法,其特征在于,所述方法包括:提取待进行数据质量评估的医院数据库表元数据信息,补充完善该表的数据模型和显示模型;将补充完善完成的数据模型和显示模型中的表信息添加到数据资产列表中,成为确定待设置质量检查的对象列表;通过显示模型可浏览一个表对象的数据信息,通过可维护的检查规则逐一对表对象中的列进行检查规则配置,一个列得到至少一个列检查视图;针对表可以设置多个表检查方案,一个表检查方案可以对应多个不同的列检查视图,通过对表检查方案的执行得到表的数据质量分数和列所属数据质量级别;针对数据资产可以设置多个评估方案,不同的评估方案可以对应多个不同的表检查方案,通过对评估方案的执行得到本次评估数据质量分数和表所属数据质量级别。2.根据权利要求1所述的方法,在一个表检查方案中可以设置列的质量权重和质量级别范围,其特征在于,所述一个表检查方案可以对应多个不同的列检查视图,通过对表检查方案的执行得到表的数据质量分数和列所属数据质量级别,还包括:所述数据资产列表中可以有多个检查方案,每个检查方案都可以由不同的列检查视图组成,每个检查方案中的列检查视图权重都可以不同、质量级别范围不同;具体地,可以对表检查方案执行,通过逐一将表检查方案中的列检查视图动态生成SQL语句,对表对象的业务数据进行查询得到检出问题数量,通过检出问题数量与检查记录数得到正确率;根据所述正确率与列的质量权重得到检查视图的字段得分和列质量级别,通过各个字段得分之和得到表检查方案得分和各列质量级别。3.根据权利要求1所述的方法,其特征在于,确定表检查方案所对应的列检查视图,根据确定的列检查视图形成至少一个表检查方案,包括:通过第一公式形成所述表检查方案,其中,第一公式具体包括:N=Sum(Fv1×
w1+Fv2×
w2+

+Fv
n
×
w
n
)其中,N表示表检查方案本次执行得分,所述表检查方案得分用于表征所述检查方案的质量,Sum表示每个列检查视图的字段得分合计,n表示第n个检查视图,Fv表示列检查视图得分,w表示列检查视图在该表质量检查方案的权重。4.根据权利要求1所述的方法,在一个评估方案中可以设置表检查方案质量权重和质量级别范围,其特征在于,可以设置多个评估方案,每一个评估方案可以对应多个不同的表检查方案,每个评估方案中的表检查方案权重都可以不同、质量级别范围不同,还包括:...

【专利技术属性】
技术研发人员:李昕
申请(专利权)人:北京蓝海医信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1