【技术实现步骤摘要】
基于知识库的数据核查方法、装置、电子设备及存储介质
[0001]本专利技术实施例涉及数据处理
,尤其涉及一种基于知识库的数据核查方法、装置、电子设备及存储介质。
技术介绍
[0002]随着医疗数据信息化进程的不断推进,需要处理的医疗数据量越来越大,在数据生产、抽取、转化和录入过程中均可能存在数据的异常,为了确保处理过程中的数据质量,通常需要对数据进行质量核查。
[0003]现有技术中,针对医疗领域中产生的各种数据表,在核查时均基于数据表反映的实体内容,确定对应的核查方式;如预约挂号表中的科室名称、缴费表中的缴费项目,均为实体内容,需要基于每个实体内容确定对应的核查方式。
[0004]但是,由于医疗领域数据量较大,为每个实体内容均确定核查方式工作较为繁琐,费时费力。
技术实现思路
[0005]本专利技术实施例提供了一种基于知识库的数据核查方法、装置、电子设备及存储介质,以实现高效、便捷地对待核查数据进行质量核查的目的。
[0006]第一方面,本专利技术实施例提供了一种基于知识库的数 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识库的数据核查方法,其特征在于,包括:获取待核查数据及用于描述所述待核查数据的目标元数据;基于所述目标元数据,确定所述待核查数据的目标数据类型;基于预先建立的数据核查知识库,确定所述待核查数据对应的目标核查方式,以采用所述目标核查方式对所述待核查数据进行质量核查;其中,所述数据核查知识库对数据类型与核查方式进行对应存储。2.根据权利要求1所述的方法,其特征在于,在所述确定所述待核查数据对应的目标核查方式之前,还包括:将元数据中的数据元分为各所述数据类型;基于预设绑定规则为各所述数据类型绑定核查方式,以建立所述数据类型与所述核查方式之间的对应关系;基于各所述对应关系构建所述数据核查知识库;其中,所述核查方式包括非空核查、字符长度核查、值域范围核查、枚举值核查、数据类型核查、数据关联性核查、数据合理性核查和数据相关性核查中的至少一种。3.根据权利要求2所述的方法,其特征在于,所述将元数据中的数据元分为各所述数据类型,包括:基于元数据中数据元的数据格式,将各所述数据元分为不同的数据类型;其中,所述数据类型包括字符类型、数值类型、布尔类型、日期类型、日期时间类型、时间类型和二进制类型中的至少一种。4.根据权利要求2所述的方法,其特征在于,所述将元数据中的数据元分为各所述数据类型,包括:基于所述元数据中的数据元的描述属性,将各所述数据元分为不同的数据类型;其中,所述描述属性包括表属性、字段属性和角色属性中的至少一种。5.根据权利要求4所述的方法,其特征在于,所述将元数据中的数据元分为各所述数据类型,包括:基于所述元数据中的数据元的描述属性,确定所述数据元的数据子类型;基于预先建立的数据子类型与数据主类型之间的层级继承关系,确定所述数据元的数据主类型;其中,所述数据主类型包括表、...
【专利技术属性】
技术研发人员:秦晓宏,黄主斌,
申请(专利权)人:上海柯林布瑞信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。