当前位置: 首页 > 专利查询>武汉大学专利>正文

一种计量信息类型的医疗数据的处理方法及装置制造方法及图纸

技术编号:28380071 阅读:20 留言:0更新日期:2021-05-08 00:08
本发明专利技术公开了一种计量信息类型的医疗数据的处理方法及装置,该方法包括:获取医疗数据库中的计量信息,计量信息为医疗数据库中各医学指标下纯数值类型的数据;对计量信息中的异常数据进行清洗后整合;根据医疗机构检测仪器所对应的合法计量范围,对计量信息中的医疗指标进行多单位特征处理;对同一医疗指标下的同一单位特征、同一合法计量范围标记的原始计量信息进行独立提取,形成独立数据集;对独立数据集的计量信息进行转等级化信息处理;对计量信息进行合并且对冲突进行校正;对校正后计量信息进行统计分析,得到治理后计量信息。本发明专利技术可以提高医疗数据的治理能力和利用率。

【技术实现步骤摘要】
一种计量信息类型的医疗数据的处理方法及装置
本专利技术涉及医疗信息
,尤其涉及一种计量信息类型的医疗数据的处理方法及装置。
技术介绍
随着信息技术的不断发展,医院的信息化程度逐渐提高,医疗数据的范围和规模也越来越大,如何有效地提取、存储、利用这些医疗数据已经成为一个越来越重要的问题。目前医院中各科室使用的医疗系统是彼此独立运行的,分别管理着各自科室患者的医疗数据,同时,各医疗体系的架构、数据格式、编码标准可能不同,因此无法集成医院各医疗系统的医疗数据,实现医疗数据的结构化,这大大降低了医疗数据的利用率。尽管目前一些临床数据中心有一定的数据治理能力,但是仍然缺乏对医疗数据的专业性加工。所以在这样的大背景下,急需提高对医疗数据进行分类处理、加工的能力,以准确获取有效的医疗数据,提高医疗数据的利用率。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种计量信息类型的医疗数据的处理方法及装置。本专利技术解决其技术问题所采用的技术方案是:本专利技术提供一种计量信息类型的医疗数据的处理方法,该方法包括以下步骤:获取医疗数据库中的计量信息,计量信息为医疗数据库中各医学指标下纯数值类型的数据;对计量信息中的异常数据进行清洗后整合;根据医疗机构检测仪器所对应的合法计量范围,对计量信息中的医疗指标进行多单位特征处理;对同一医疗指标下的同一单位特征、同一合法计量范围标记的原始计量信息进行独立提取,形成独立数据集;对独立数据集的计量信息进行转等级化信息处理;对计量信息进行合并且对冲突进行校正;对校正后计量信息进行统计分析,得到治理后计量信息。进一步地,本专利技术的该方法中所述的获取医疗数据库中的计量信息,其具体方法为:对从合作医疗机构中收集得到的计量信息添加特征标记,根据特征标记将计量信息从医疗数据库中提取出来,形成单独的计量信息数据库。进一步地,本专利技术的该方法中所述的对计量信息添加特征标记的具体方法为:在列名标准化处理的过程中,为每一列计量信息附加特征标记,用于标记其数据类型。进一步地,本专利技术的该方法中所述的异常数据具体为:异常数据为医疗数据库中非纯数值类型的数据,包括纯文本的文本信息,纯等级的等级信息,无具体意义的不合法信息,以及上述任何一种或者几种类型信息与或不与数值类型信息组合在一起的混杂信息。进一步地,本专利技术的该方法中所述的对计量信息中的指标进行多单位特征处理,其具体方法为:根据同一医疗指标具有不同的合法计量范围,对同一医疗指标进行多合法计量范围的格式标准化;根据该医疗指标下的计量信息分布在合法计量范围内所代表的不同医学意义对多合法计量范围添加相应的等级化特征;标记为相同的合法计量范围的计量信息形成同一个单位特征,将单位特征添加至相应的医疗指标,使同一医疗指标具有多个单位特征;其具体算法包括:1)根据国际性术语集对不同来源体检数据指标名称进行标准化并以此为基础建立自定义标准术语集,将前期清洗好的计量信息数据构建计量信息指标的标准分布数据库;2)待清洗的数据经过算法的处理得到非纯数值形态的数据列表,通过算法进行正则匹配将非法的数值形态进行校正,得到纯的计量信息数据,同时,再根据自定义标准术语表给定的合法范围进行算法逻辑关系判断,将计量指标中小于参考值下限及大于参考值上限的内容清掉,得到合法范围内的计量资料的数据;3)待确认的医疗计量数据与医学标准术语分布数据库进行相似性比较,同一家机构的数据的同一指标下的一整列数据根据原始机构给的参考范围数据表中对应的医学参考范围将数据进行提取,进而将这些提取的数据与标准术语库中对应的标准分布数据库的数据进行比较,统计二者的相关参数,令相关系数为r,二者的中位数分别为m1和m2,四分之一位数分别为a1和a2,四分之三位数分别为b1和b2,并通过统计的相关参数来计算权重值;权重值w的计算方法为:w=r*10-(m1-m2)*3-(a1-a2)/a1*3-(b1-b2)/b1*3;接下来进行数据量总量形态频次统计的柱状图、数据分布的箱线图、数据的密度分布图展示及比较,算法根据权重值推荐最相似的标准术语库内的指标名称;如果待清洗的指标不存在与现有的标准分布数据库中,那么只进行该指标的分布展示,并计算相关参数,生成该指标的箱线图、密度分布图,并形成相关性统计结果及分布图;4)得到对每一个指标下的同一单位下的指标数值产生的相关性统计结果及分布图后,根据权重值及分布形态推荐最终的计量资料指标名称及其相应的正确的参考范围,通过算法实现该待清洗计量指标的标准化,然后根据其医学参考范围转为颗粒度大的相应的等级形态的数据,根据转换规则,将该指标的数据转换为等级化后的形态:1表示偏低,2表示正常,3表示偏高,用于后续数据清洗;5)将清洗好的计量信息数据根据相同的术语列进行合并,进行分布展示及系统误差质检。进一步地,本专利技术的该方法中所述的对计量信息中的医疗指标进行多单位特征处理,其具体方法还包括生成A类映射表的方法:根据医疗机构提供的某个医疗指标在不同检测方法和不同检测批次下的产生的该指标所对应的正常值范围,形成每一个计量信息的数值都有所对应的、判断其医学意义的规则表,即A类映射表,以对每一个计量信息的数值背后的医学意义进行标记;根据A类映射表,对该医疗指标下同一正常值范围标记的数值进行独立提取。进一步地,本专利技术的该方法中所述的计量信息进行转等级化信息处理,其具体方法为:根据等级化特征将原始计量信息转化为相应的等级化信息,然后将每一个独立数据集产生的等级化信息进行合并,最后使同一医疗指标下的同一单位特征的计量信息全部转化为等级信息。进一步地,本专利技术的该方法中所述的对计量信息进行合并冲突校正,其具体方法为:将所有同一医疗指标、同一单位特征下的独立数据集中的原始计量信息进行合并,将同一患者对应有两个或两个以上相同医疗指标、相同单位特征的计量信息标记为合并冲突,最后从合并冲突中选择唯一的、正确的计量信息。进一步地,本专利技术的该方法中所述的对校正后计量信息进行统计分析,其具体方法为:将校正后的计量信息与从其他合作医疗机构收集并清洗得来的同一指标、同一单位特征的计量信息一起进行系统误差核对,根据统计学领域的一致性定义,将不合格的计量信息进行标记,标记后的计量信息通过进一步校正,确认合格后得到治理后计量信息。本专利技术提供一种计量信息类型的医疗数据的处理方装置,该装置包括以下模块:读取模块,用于从收集得到的混杂资料类型的医疗数据中读取具有特征标记的计量信息;异常数据清洗模块,用于从所述具有特征标记的计量信息中提取异常数据并进行清除;多单位特征处理模块,用于对同一合法计量范围标记下的原始计量信息进行独立提取,使提取后的原始计量信息形成独立数据集;转化模块,用于对独立数据集中的原始计量信息转化为相应的等级化信息;合并模块,用于对独立数据集产生的等级本文档来自技高网...

【技术保护点】
1.一种计量信息类型的医疗数据的处理方法,其特征在于,该方法包括以下步骤:/n获取医疗数据库中的计量信息,计量信息为医疗数据库中各医学指标下纯数值类型的数据;/n对计量信息中的异常数据进行清洗后整合;/n根据医疗机构检测仪器所对应的合法计量范围,对计量信息中的医疗指标进行多单位特征处理;/n对同一医疗指标下的同一单位特征、同一合法计量范围标记的原始计量信息进行独立提取,形成独立数据集;/n对独立数据集的计量信息进行转等级化信息处理;/n对计量信息进行合并且对冲突进行校正;/n对校正后计量信息进行统计分析,得到治理后计量信息。/n

【技术特征摘要】
1.一种计量信息类型的医疗数据的处理方法,其特征在于,该方法包括以下步骤:
获取医疗数据库中的计量信息,计量信息为医疗数据库中各医学指标下纯数值类型的数据;
对计量信息中的异常数据进行清洗后整合;
根据医疗机构检测仪器所对应的合法计量范围,对计量信息中的医疗指标进行多单位特征处理;
对同一医疗指标下的同一单位特征、同一合法计量范围标记的原始计量信息进行独立提取,形成独立数据集;
对独立数据集的计量信息进行转等级化信息处理;
对计量信息进行合并且对冲突进行校正;
对校正后计量信息进行统计分析,得到治理后计量信息。


2.根据权利要求1所述的计量信息类型的医疗数据的处理方法,其特征在于,该方法中所述的获取医疗数据库中的计量信息,其具体方法为:
对从合作医疗机构中收集得到的计量信息添加特征标记,根据特征标记将计量信息从医疗数据库中提取出来,形成单独的计量信息数据库。


3.根据权利要求2所述的计量信息类型的医疗数据的处理方法,其特征在于,该方法中所述的对计量信息添加特征标记的具体方法为:在列名标准化处理的过程中,为每一列计量信息附加特征标记,用于标记其数据类型。


4.根据权利要求1所述的计量信息类型的医疗数据的处理方法,其特征在于,该方法中所述的异常数据具体为:
异常数据为医疗数据库中非纯数值类型的数据,包括纯文本的文本信息,纯等级的等级信息,无具体意义的不合法信息,以及上述任何一种或者几种类型信息与或不与数值类型信息组合在一起的混杂信息。


5.根据权利要求1所述的计量信息类型的医疗数据的处理方法,其特征在于,该方法中所述的对计量信息中的指标进行多单位特征处理,其具体方法为:
根据同一医疗指标具有不同的合法计量范围,对同一医疗指标进行多合法计量范围的格式标准化;
根据该医疗指标下的计量信息分布在合法计量范围内所代表的不同医学意义对多合法计量范围添加相应的等级化特征;
标记为相同的合法计量范围的计量信息形成同一个单位特征,将单位特征添加至相应的医疗指标,使同一医疗指标具有多个单位特征;其具体算法包括:
1)根据国际性术语集对不同来源体检数据指标名称进行标准化并以此为基础建立自定义标准术语集,将前期清洗好的计量信息数据构建计量信息指标的标准分布数据库;
2)待清洗的数据经过算法的处理得到非纯数值形态的数据列表,通过算法进行正则匹配将非法的数值形态进行校正,得到纯的计量信息数据,同时,再根据自定义标准术语表给定的合法范围进行算法逻辑关系判断,将计量指标中小于参考值下限及大于参考值上限的内容清掉,得到合法范围内的计量资料的数据;
3)待确认的医疗计量数据与医学标准术语分布数据库进行相似性比较,同一家机构的数据的同一指标下的一整列数据根据原始机构给的参考范围数据表中对应的医学参考范围将数据进行提取,进而将这些提取的数据与标准术语库中对应的标准分布数据库的数据进行比较,统计二者的相关参数,令相关系数为r,二者的中位数分别为m1和m2,四分之一位数分别为a1和a2,四分之三位数分别为b1和b2,并通过统计的相关参数来计算权重值;权重值w的计算方法为:w=r*10-(m1-m2)*3-(a1-a2)/a1*3-(b1-b2)/b1*3;接下来进行数据量总量形态频次统计的柱状图、数据分布的箱线图、数据的密度分布图展示及比较,算法...

【专利技术属性】
技术研发人员:李红良李浩淼汪文鑫
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1