当前位置: 首页 > 专利查询>武汉大学专利>正文

提高医疗等级型数据矫正效率的方法、系统及存储介质技术方案

技术编号:28380078 阅读:15 留言:0更新日期:2021-05-08 00:08
本发明专利技术公开了一种提高医疗等级型数据矫正效率的方法、系统及存储介质,该方法包括步骤:提取待分析的等级型指标的等级数据;统计总体数据和待分析机构中该指标的等级和各等级的数量,并利用3种归类方法进行归类;计算这3种归类方法下,该指标在总体数据和该机构中的归类占比;在每种归类方法下,利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;每有一种归类方法存在显著性差异,则该机构累加1分;统计该机构的总分数;根据总分数判断数据是否异常并对异常数据进行矫正。本发明专利技术可解决海量医疗数据清洗中等级型数据的质量的评估和错误的智能侦测及矫正,有效降低数据治理的成本,提高健康医疗数据治理的效率和准确度。

【技术实现步骤摘要】
提高医疗等级型数据矫正效率的方法、系统及存储介质
本专利技术属于数据处理
,具体涉及一种提高医疗等级型数据矫正效率的方法、系统及存储介质。
技术介绍
近年来,医疗卫生信息化建设速度不断加快,医疗数据迅猛增长。由于信息标准不一、数据结构不一、信息录入缺乏质控等原因,产生了大量的“脏数据”,这些数据给健康医疗大数据信息关联和挖掘分析造成了障碍。必须健康医疗数据进行系统性的数据治理,提高数据的质量。基于经过数据治理后形成的标准化数据集,运用大数据分析挖掘的方法,才能真正发现数据中隐藏的价值规律。而医疗大数据体量巨大,仅靠人工核对、矫正数据会消耗大量财力,时间和人力,也无法保证结果的准确性,会极大的增加了数据治理和应用的成本。
技术实现思路
本专利技术解决的目的在于,提供一种提高医疗等级型数据矫正效率的方法、系统及存储介质,对医疗数据中的等级型变量数据进行统计分析,找出异常数据并进行矫正,降低数据治理的成本,提高数据治理的效率。本专利技术提供一种提高医疗等级型数据矫正效率的方法,包括以下步骤:从多个医疗机构的医疗数据中,提取待分析的等级型指标的等级数据;统计总体数据和待分析机构中该指标的等级和各等级的数量;等级包括肯定性等级、否定性等级和可疑性等级;对总体数据和该机构中的该指标的等级,利用以下3种归类方法进行归类:①去掉可疑性等级,计算肯定性等级、否定性等级的占比;②将可疑性等级归入肯定性等级,计算归入后肯定性等级、否定性等级的占比;③将可疑性等级归入否定性等级,计算肯定性等级、归入后否定性等级的占比;计算这3种归类方法下,该指标在总体数据和该机构中的归类占比;在每种归类方法下,利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;每有一种归类方法存在显著性差异,则该机构累加1分;统计该机构的总分数;根据总分数判断该等级型指标的等级数据是否异常,并对异常数据进行数据矫正。进一步地,若该指标仅包括肯定性等级和否定性等级,则直接利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;若是,则该机构的该等级型指标的数据异常的可能性高。进一步地,计算该指标下各机构的总分数。进一步地,最后利用柱状图或雷达图的方法,将该指标下总体数据中各等级数据和各机构的各等级数据可视化,辅助查找异常数据。进一步地,从多个机构的医疗数据中,并行提取待分析的等级型指标的等级数据,并行计算归类占比。本专利技术还提供一种用于实现上述提高医疗等级型数据矫正效率的方法的提高医疗等级型数据矫正效率的系统,包括:数据提取模块,用于从多个医疗机构的医疗数据中,提取待分析的等级型指标的等级数据;等级统计模块,用于统计总体数据和待分析机构中该指标的等级和各等级的数量;等级包括肯定性等级、否定性等级和可疑性等级;等级归类模块,用于对总体数据和该机构中的该指标的等级,利用以下3种归类方法进行归类:①去掉可疑性等级,计算肯定性等级、否定性等级的占比;②将可疑性等级归入肯定性等级,计算归入后肯定性等级、否定性等级的占比;③将可疑性等级归入否定性等级,计算肯定性等级、归入后否定性等级的占比;归类占比模块,用于计算这3种归类方法下,该指标在总体数据和该机构中的归类占比;卡方检验模块,用于在每种归类方法下,利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;每有一种归类方法存在显著性差异,则该机构累加1分;计分统计模块,用于统计该机构的总分数;根据总分数判断该等级型指标的等级数据是否异常,并对异常数据进行数据矫正。进一步地,还包括可视化模块,用于利用柱状图或雷达图的方法,将该指标下总体数据中各等级数据和该机构的各等级数据可视化,辅助查找异常数据。本专利技术还提供一种计算机存储介质,其内存储有可被计算机处理器执行的计算机程序,该计算机程序执行上述的提高医疗等级型数据矫正效率的方法。本专利技术的有益效果是:本专利技术的提高医疗等级型数据矫正效率的方法、系统及存储介质,可解决海量医疗数据清洗中等级型数据的质量的评估和错误的智能侦测及矫正,有效降低数据治理的成本,提高健康医疗数据治理的效率和准确度。进一步地,计算该指标下各机构的总分数,可以通过比较各机构的总分数来快速查找数据异常的机构,对并异常数据进行矫正。进一步地,提供可视分析结果,辅助查找异常数据,分数和可视化结果相结合,提高查找的准确率,同时可以迅速、直观地确认问题数据。附图说明图1是本专利技术的提高医疗等级型数据矫正效率的方法流程图。图2是本专利技术的3种归类方法示意图。图3是本专利技术的可视化结果示意图。图4是本专利技术的提高医疗等级型数据矫正效率的系统示意图。具体实施方式下面将结合附图对本专利技术作进一步的说明:本专利技术的提高医疗等级型数据矫正效率的方法、系统及存储介质,可解决海量医疗数据清洗中等级型数据的质量的评估和错误的智能侦测,有效降低数据治理的成本,提高健康医疗数据治理的效率和准确度。本专利技术实施例的提高医疗等级型数据矫正效率的方法,如图1所示,包括以下步骤:S1、从多个医疗机构的医疗数据中,提取待分析的等级型指标的等级数据。将获取的健康医疗数据切割成若干个小数据集,通过正则匹配的方式,并行从数据集中提取等级型的指标,如III型前胶原N端肽_等级,统计出每个等级型指标在每个机构中的非空值的数量,及在上一步中的小数据集编号,并将此信息作为检索信息以便复查溯源使用。S2、统计总体数据和待分析机构中该指标的等级和各等级的数量;等级包括肯定性等级、否定性等级和可疑性等级。假设待分析的等级型指标在A机构中分为:阴性、弱阳性、阳性、强阳性和强强阳性,在B机构中分为:阴性、弱阳性、阳性、强阳性、强强阳性和强强强阳性;其中,阳性、强阳性、强强阳性和强强强阳性均为肯定性等级,阴性为否定性等级,而弱阳性是指在检查中出现的可能性,还无法完全确定,需要再次检查以确定,因此属于可疑性等级。需要说明的是,肯定性等级和否定性等级是相对的,若将阳性、强阳性、强强阳性和强强强阳性分为否定性等级,则阴性为肯定性等级。此外,等级型指标也可以是其他的等级型分类,例如耳部、眼睛等检查结果包括:不正常、未见明显异常、正常;其中不正常可划分为否定性数据,未见明显异常划分为可疑性等级,正常划分为肯定性等级。S3、对总体数据和该机构中的该指标的等级,利用以下3种归类方法进行归类:①去掉可疑性等级,计算肯定性等级、否定性等级的占比;②将可疑性等级归入肯定性等级,计算归入后肯定性等级、否定性等级的占比;③将可疑性等级归入否定性等级,计算肯定性等级、归入后否定性等级的占比。由于弱阳性这一类等级属于可疑性等级,因此在分析的时候,需要将可疑性等级进行归类。如图2所示,以待分析机构的待分析指标等级为阴性(等级1)、弱阳本文档来自技高网...

【技术保护点】
1.一种提高医疗等级型数据矫正效率的方法,其特征在于,包括以下步骤:/n从多个医疗机构的医疗数据中,提取待分析的等级型指标的等级数据;/n统计总体数据和待分析机构中该指标的等级和各等级的数量;等级包括肯定性等级、否定性等级和可疑性等级;/n对总体数据和该机构中的该指标的等级,利用以下3种归类方法进行归类:/n①去掉可疑性等级,计算肯定性等级、否定性等级的占比;/n②将可疑性等级归入肯定性等级,计算归入后肯定性等级、否定性等级的占比;/n③将可疑性等级归入否定性等级,计算肯定性等级、归入后否定性等级的占比;/n计算这3种归类方法下,该指标在总体数据和该机构中的归类占比;/n在每种归类方法下,利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;每有一种归类方法存在显著性差异,则该机构累加1分;/n统计该机构的总分数;根据总分数判断该等级型指标的等级数据是否异常,并对异常数据进行数据矫正。/n

【技术特征摘要】
1.一种提高医疗等级型数据矫正效率的方法,其特征在于,包括以下步骤:
从多个医疗机构的医疗数据中,提取待分析的等级型指标的等级数据;
统计总体数据和待分析机构中该指标的等级和各等级的数量;等级包括肯定性等级、否定性等级和可疑性等级;
对总体数据和该机构中的该指标的等级,利用以下3种归类方法进行归类:
①去掉可疑性等级,计算肯定性等级、否定性等级的占比;
②将可疑性等级归入肯定性等级,计算归入后肯定性等级、否定性等级的占比;
③将可疑性等级归入否定性等级,计算肯定性等级、归入后否定性等级的占比;
计算这3种归类方法下,该指标在总体数据和该机构中的归类占比;
在每种归类方法下,利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;每有一种归类方法存在显著性差异,则该机构累加1分;
统计该机构的总分数;根据总分数判断该等级型指标的等级数据是否异常,并对异常数据进行数据矫正。


2.根据权利要求1所述的提高医疗等级型数据矫正效率的方法,其特征在于,若该指标仅包括肯定性等级和否定性等级,则直接利用卡方检验,判断该机构的等级数据与总体数据是否存在显著性差异;若是,则该机构的该等级型指标的数据异常的可能性高。


3.根据权利要求1或2所述的提高医疗等级型数据矫正效率的方法,其特征在于,计算该指标下各机构的总分数。


4.根据权利要求3所述的提高医疗等级型数据矫正效率的方法,其特征在于,最后利用柱状图或雷达图的方法,将该指标下总体数据中各等级数据和各机构的各等级数据可视化,辅助查找异常数据。


5.根据权利要求1所述的提高医疗等级...

【专利技术属性】
技术研发人员:李红良柳叶茂黄学伟
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1