医疗数据生产的质控方法、装置以及电子设备制造方法及图纸

技术编号:24937837 阅读:19 留言:0更新日期:2020-07-17 20:54
本公开提供了一种医疗数据生产的质控方法、装置及电子设备,涉及医疗数据处理技术领域。该方法包括:将获取到的医疗数据进行结构化处理,得到生产数据;确定预设字段组对应的生产数据的待测指标;根据待测指标以及待测指标对应的判断条件,判断所述预设字段组对应的生产数据是否符合判断条件,若否,则确定预设字段组对应的生产数据存在问题。本技术方案能够快速准确地定位结构化处理中问题数据,从而便于优化问题数据以提升生产数据的质量,同时,相较于人工质控,提升了质控效率。

【技术实现步骤摘要】
医疗数据生产的质控方法、装置以及电子设备
本公开涉及医疗数据处理
,具体而言,涉及一种医疗数据生产的质控方法、医疗数据生产的质控装置以及实现上述方法的电子设备。
技术介绍
医疗领域中源源不断地产生大量的医疗数据,例如:患者的病历、对患者的病例的分析、患者疾病的治疗方案等。一般将医疗数据结构化来实现对医疗数据的管理与分析。在数据结构化之后,通过数据质量控制(简称“质控”)的方式来获取数据改善措施,从而保障结构化后数据的数据质量。目前对医疗数据生产的质控方案,是通过人工质检的方式进行。然而,人工质检的方式存在处理效率低的缺点。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开实施例的目的在于提供一种医疗数据生产的质控方法、医疗数据生产的质控装置、计算机可读介质及电子设备,进而至少在一定程度上提升了医疗数据生产的质控效率。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开实施例的第一方面,提供了一种医疗数据生产的质控方法,该方法包括:将获取到的医疗数据进行结构化处理,得到生产数据;确定预设字段组对应的生产数据的待测指标;根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标对应的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题。在本公开的一种实施例中,基于前述方案,上述将获取到的医疗数据进行结构化处理,得到生产数据,包括:获取目标疾病的特征指标;根据上述特征指标对上述医疗数据进行结构化处理,得到关于上述目标疾病画像的生产数据。在本公开的一种实施例中,基于前述方案,上述待测指标包括数据类型、格式特征、值域范围以及填充率中的任一种或任几种。在本公开的一种实施例中,基于前述方案,上述待测指标为数据类型,其中,上述根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标对应的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题,包括:获取上述预设字段组中每个生产数据的数据类型,以及获取上述预设字段组中生产数据的配置数据类型;响应于上述生产数据的数据类型不同于上述配置数据类型,确定不同于上述配置数据类型的目标数据的数量;计算上述目标数据的数量与上述预设字段组中生产数据的总数量的占比,并判断上述占比是否小于或等于第一预设阈值,若否,则确定上述预设字段组对应的生产数据存在问题;上述待测指标为格式特征,其中,上述根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标对应的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题,包括:获取上述预设字段组中每个生产数据的格式特征,以及获取上述生产数据的配置数据类型对应的标准格式特征;响应于上述生产数据的格式类型不同于上述标准格式特征,确定不同于上述标准格式特征的目标数据的数量;判断上述目标数据的数量是否小于或等于第二预设阈值,若否,则确定上述预设字段组对应的生产数据存在问题;上述待测指标为值域范围,其中,上述根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标对应的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题,包括:获取上述预设字段组中每个生产数据的值域,以及获取对上述生产数据的配置数据类型对应的标准值域;响应于上述生产数据的值域不在上述标准值域范围内,确定不满足上述标准值域的目标数据的数量;判断上述目标数据的数量是否小于或等于第三预设阈值,若否,则确定上述预设字段组对应的生产数据存在问题。在本公开的一种实施例中,基于前述方案,在上述确定上述预设字段组中的问题字段之后,上述方法还包括:在上述预设字段组中获取上述目标数据所在的目标字段,以定位得到问题数据;重新对上述目标字段的医疗数据进行结构化处理,并对重新结构化处理后的生产数据进行测试,以使所述目标字段中生产数据的待测指标符合所述待测指标对应的判断条件。在本公开的一种实施例中,基于前述方案,上述方法还包括:获取上述目标字段中每个上述问题数据的实际生产路径,以根据上述实际生产路径确定上述问题数据的来源。在本公开的一种实施例中,基于前述方案,上述待测指标为填充率,其中,上述根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标对应的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题,包括:确定上述预设字段组中生产数据的填充率;判断上述预设字段组中生产数据的填充率是否大于或等于第四预设阈值,若否,则确定上述预设字段组对应的生产数据存在问题。在本公开的一种实施例中,基于前述方案,在上述确定上述预设字段组中的问题字段之后,上述方法还包括:在上述预设字段组中获取未填充的字段作为目标字段,以定位得到问题数据;重新对上述目标字段的医疗数据进行结构化处理,并对重新结构化处理后的生产数据进行测试,以使上述目标字段中生产数据的填充率大于或等于上述第四预设阈值。根据本公开实施例的第二方面,提供了一种医疗数据生产的质控装置,包括:生产数据确定模块、待测指标确定模块和判断模块。其中,生产数据确定模块,用于:将获取到的医疗数据进行结构化处理,得到生产数据;待测指标确定模块,用于:确定预设字段组对应的生产数据的待测指标;判断模块,用于:根据上述待测指标以及上述待测指标对应的判断条件,判断上述预设字段组对应的生产数据的待测指标是否符合上述待测指标的判断条件,若否,则确定上述预设字段组对应的生产数据存在问题。根据本公开实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例第一方面中所述的医疗数据生产的质控方法。根据本公开实施例的第四方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例第一方面所述的医疗数据生产的质控方法。本公开实施例提供的技术方案可以包括以下有益效果:在本公开的一些实施例中,首先获取到的医疗数据进行结构化处理得到生产数据,然后确定预设字段组的待测指标及其对应的判断条件,进而将预设字段组的生产数据与判断条件进行自动化比对,以实现对预设字段组的自动化测试。进一步地,若预设字段组对应的生产数据的待测指标不符合待测指标的判断条件,则确定该预设字段组对应的生产数据存在问题,从而快速准确地定位上述结构化处理中问题数据,以最终针对该问题数据确定解决方案。可见,本技术方案通本文档来自技高网...

【技术保护点】
1.一种医疗数据生产的质控方法,其特征在于,包括:/n将获取到的医疗数据进行结构化处理,得到生产数据;/n确定预设字段组对应的生产数据的待测指标;/n根据所述待测指标以及所述待测指标对应的判断条件,判断所述预设字段组对应的生产数据的待测指标是否符合所述待测指标对应的判断条件,若否,则确定所述预设字段组对应的生产数据存在问题。/n

【技术特征摘要】
1.一种医疗数据生产的质控方法,其特征在于,包括:
将获取到的医疗数据进行结构化处理,得到生产数据;
确定预设字段组对应的生产数据的待测指标;
根据所述待测指标以及所述待测指标对应的判断条件,判断所述预设字段组对应的生产数据的待测指标是否符合所述待测指标对应的判断条件,若否,则确定所述预设字段组对应的生产数据存在问题。


2.根据权利要求1所述的医疗数据生产的质控方法,其特征在于,所述将获取到的医疗数据进行结构化处理,得到生产数据,包括:
获取目标疾病的特征指标;
根据所述特征指标对所述医疗数据进行结构化处理,得到关于所述目标疾病画像的生产数据。


3.根据权利要求1所述的医疗数据生产的质控方法,其特征在于,所述待测指标包括数据类型、格式特征、值域范围以及填充率中的任一种或任几种。


4.根据权利要求3所述的医疗数据生产的质控方法,其特征在于,所述待测指标为数据类型,其中,所述根据所述待测指标以及所述待测指标对应的判断条件,判断所述预设字段组对应的生产数据的待测指标是否符合所述待测指标对应的判断条件,若否,则确定所述预设字段组对应的生产数据存在问题,包括:
获取所述预设字段组中每个生产数据的数据类型,以及获取所述预设字段组中生产数据的配置数据类型;
响应于所述生产数据的数据类型不同于所述配置数据类型,确定不同于所述配置数据类型的目标数据的数量;
计算所述目标数据的数量与所述预设字段组中生产数据的总数量的占比,并判断所述占比是否小于或等于第一预设阈值,若否,则确定所述预设字段组对应的生产数据存在问题;
所述待测指标为格式特征,其中,所述根据所述待测指标以及所述待测指标对应的判断条件,判断所述预设字段组对应的生产数据的待测指标是否符合所述待测指标对应的判断条件,若否,则确定所述预设字段组对应的生产数据存在问题,包括:
获取所述预设字段组中每个生产数据的格式特征,以及获取所述生产数据的配置数据类型对应的标准格式特征;响应于所述生产数据的格式类型不同于所述标准格式特征,确定不同于所述标准格式特征的目标数据的数量;判断所述目标数据的数量是否小于或等于第二预设阈值,若否,则确定所述预设字段组对应的生产数据存在问题;
所述待测指标为值域范围,其中,所述根据所述待测指标以及所述待测指标对应的判断条件,判断所述预设字段组对应的生产数据的待测指标是否符合所述待测指标对应的判断条件,若否,则确定所述预设字段组对应的生产数据存在问题,包括:
获取所述预设字段组中每个生产数据的值域,以及获取对所述生产数据的配置数据类型对应的标准值域;响应于所述生产...

【专利技术属性】
技术研发人员:范梦洁马莎陈翔宇杜硕刘水清
申请(专利权)人:南京医渡云医学技术有限公司南京懿医云大数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1