一种面向医疗质量评价的大数据挖掘方法技术

技术编号:14113646 阅读:78 留言:0更新日期:2016-12-07 10:59
一种面向医疗质量评价的大数据挖掘方法,本发明专利技术涉及大数据挖掘在医疗质量评价领域,其旨在解决现有技术中数据采样值选取过于经验化、数据处理结构中冗余数据过多且医疗质量评定模型与病例数据关联度过低等技术问题。本发明专利技术方法主要包括预处理,使处理后的数据满足后续步骤的要求;模型聚类分级,将数据挖掘中的聚类思想应用到医疗质量评价中各个因素的打分中;模型病例质量计算,针对每一条的病例,进行基于病例质量模型的分数计算;模型结果输出,根据每一条的病例质量分数,计算出医疗单位最终的医疗质量分数,进而得到最终的结果。本发明专利技术用于提供医疗质量评价方法。

【技术实现步骤摘要】

本专利技术涉及数据挖掘在医疗大数据
,尤其涉及了一种面向医疗质量评价的大数据挖掘方法
技术介绍
随着大数据时代的来临,各行各业的数据量都在极速增长。而医疗大数据作为最有价值的行业大数据之一,人们对于它的研究层出不穷。将数据挖掘的方法应用到医疗大数据是这个领域最火热的研究内容之一。大数据作为医疗大数据中最重要、覆盖面最广、最真实的数据之一,有着海量性、高维度、高价值等特点。数据挖掘一般包含离群点检测、聚类、分类、推荐、关联等方法,本专利技术将大数据挖掘的相关算法思想运用到医疗质量评价模型中,具体将聚类算法应用到提出的医疗质量评价模型。从而得到一种准确、新颖的医疗质量评价方法。随着我国的医疗卫生事业的快速发展,医院作为整个医疗领域最重要的一环,医院的医疗质量也越来越重要,它代表了这个医院的健康程度。目前我国常用到的医疗质量评价方法主要分为医院评审法、综合评审法、病种质量评审法、顾客满意度评审法。但是以上方法都有着传统的医疗质量评价方法的共性缺点。一是经验主义,人工干预判断太多,有些判断相对比较草率武断;二是多是基于抽样调查,在医疗数据量极速增长的当下,越来越显的缺乏说服力。
技术实现思路
本专利技术基于大数据挖掘,针对以上缺点提出了一种面向医疗质量评价的大数据挖掘方法,其旨在解决现有技术中数据采样值选取过于经验化、数据处理结构中冗余数据过多且医疗质量评定模型与病例数据关联度过低等技术问题。为了达到上述目的,本专利技术方法如下。一种面向医疗质量评价的大数据挖掘方法,包括以下步骤步骤1、对源数据进行噪声处理,再根据数据库,完成源数据的数据格式化和对应源数据属性参数的数值化,获得预处理数据;步骤2、利用X均值聚类算法,对应预处理数据,通过循环迭代的方式计算聚类最优解,再根据聚类最优解按照病例进行聚类,获得病例缺陷因素聚类结果集;步骤3、对病例缺陷因素聚类结果集进行分类计算,获得病例参数值,再根据病例参数值,利用病例质量模型计算出病例质量分数;步骤4、根据病例质量分数,通过病例优良率公式计算出医疗单位的医疗质量分数,最后通过划分医疗质量分数等级完成医疗质量评价。上述方法中,所述的步骤1包括如下步骤,步骤1.1、将源数据中的红字相冲或数据逻辑错误进行噪声清洗处理;步骤1.2、根据数据库,将1.1处理后的数据进行数据格式化和对应源数据属性参数的数值化,获得预处理数据。上述方法中,所述的步骤2包括如下步骤,步骤2.1、设置参数K值取值范围;步骤2.2、随机选取聚类中心;步骤2.3、将对应的预处理数据分配到各自欧氏距离最近的聚类中心;步骤2.4、再重新计算新的聚类中心;步骤2.5、根据新的聚类中心所属的聚类簇,设置两个子类,再利用贝叶斯信息准则进行关于各个聚类簇父类和子类贝叶斯信息准则得分的比较处理,在循环迭代后,当聚类阈值或聚类条件满足时,该聚类簇取为聚类最优解;步骤2.6、再根据聚类最优解按照病例进行聚类,获得病例缺陷因素聚类结果集。上述方法中,所述的步骤3,包括如下步骤,步骤3.1、对病例缺陷因素聚类结果集进行分类计算,获得分类的数据集;步骤3.2、根据分类的数据集,依次计算出三个病例参数值,分别为中心点值、排序数据集中心点和缺陷值;步骤3.3、根据病例参数值,分别对病例质量模型内病例分级、医疗缺陷和医疗转归的三个参数进行打分,再代入病例质量模型计算出病例质量分数。上述方法中,所述的步骤3.3,其中所述的病例质量分数,按照病例质量分数比例预先划分为优、良、中、低、劣的五个病例评级。上述方法中,所述的步骤4,包括如下步骤,步骤4.1、根据病例质量分数,统计医疗单元病例总数和病例评级为优和良的病例总数,计算出其病例优良率,作为医疗质量分数;步骤4.2、按照医疗质量分数比例预先划分为最好、较好、一般和不好的五个医疗质量分级,最后通过医疗单位的医疗质量分数所在医疗质量分级完成医疗质量评价。与现有技术相比,本专利技术的有益效果:将数据挖掘中的聚类算法应用到医疗大数据中,从而取代了传统的医疗数据分析中人工干预过多、经验性数据采用太多、耗时耗力的弊端,从数据本身的角度处理进行分类,使得结果和模型计算更加具有说服力;提出了一种综合的、新颖的、准确的医疗质量评价方法,使得医疗大数据处理更加简单有效,对海量数据有着很好的支持,而不需要再通过抽样的方法进行计算;本专利技术立足大数据,在医疗质量评价方面进行了深入研究,有着很大的实用价值。附图说明图1为本专利技术的总体流程图;图2为本专利技术的预处理流程图;图3为本专利技术的聚类过程流程图;图4为本专利技术的病例质量计算流程图;图5为本专利技术的医疗质量评价流程图。具体实施方式本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。下面结合附图对本专利技术做进一步说明:实施例1实例数据来源为某地的医疗数据,包含就诊人员的个人信息,医疗记录,费用信息等,具体分析属性包括PID、ID、年龄、性别、参保地点编号、治疗医院编号、治疗医院等级、医疗总费用、药占比、住院时长、入院时间、日均费用、是否有并发症、出院原因,30天是否再住院。具体解释如下所示:如图1所示,为整个方法的总体流程图,本专利技术包括预处理、模型聚类分级、模型病例质量计算、模型结果输出四大步骤,每个大步骤下包含2-3个小步骤。其中预处理是为了后续的步骤进行准备,而模型聚类分级是将数据挖掘中的聚类思想应用到医疗大数据中,模型病例质量计算和模型结果输出是指本专利技术提出的一种综合的、准确的针对医疗单位医疗质量评价方法的具体体现。如图2所示,首先对源数据进行噪声处理,指对红字相冲、数据逻辑错误等“脏数据”进行处理。之后对数据进行数据格式化处理,使之满足后续步骤的输入要求。具体如下:1.1噪声处理,针对不同数据数据库设计和具体问题,消除明显错误,会影响到结果准确度的问题。在本专利技术中的问题主要是指红字相冲、明显逻辑错误两类,根据相应的规则进行处理。1.2数据格式化,针对用到的具体数据属性(数据库字段),分别进行数据格式化处理。对于有明确划分的如性别等进行数值化处理如下:1.2.1治疗医院等级,若数据库该字段值为0101,即三甲医院设置为1;若数据库该字段值为0102,即三乙医院设置为2;若数据库该字段值为0201,即二甲医院设置为3;若数据库该字段值为0202,即二乙医院设置为4;若数据库该字段值为0301,即一甲医院设置为5;若数据库该字段值为0302,即一乙医院设置为6;1.2.2性别,若性别字段值为男,设置为1;若性别字段值为女,设置为0;1.2.3是否有并发症,若第二到第八诊断都为空,即为无并发症,设为0;若第二到第八诊断至少一个不为空,即有并发症,设为1;1.2.4入院时间,由于本数据是从10年-14年的数据,故设置若为10年,设置为0;若为11年,设置为1;若为12年,设置为2;若为13年,设置为3;若为14年,设置为4;1.2.5出院原因,若为治愈,设置为1;若为正常,设置为2;若为其他,设置为3;若为转院,设置为4;若为死亡,设置为5;1.2.6 30天内是否再住院,若再住院,设置为1;若没有再住院,设置为0;其余字段保持不变,通过以上的数据预处理,所需字段都变为数值型数据,满足并便于后续步骤。如图3所本文档来自技高网...
一种面向医疗质量评价的大数据挖掘方法

【技术保护点】
一种面向医疗质量评价的大数据挖掘方法,其特征在于,包括以下步骤,步骤1、对源数据进行噪声处理,再根据数据库,完成源数据的数据格式化和对应源数据属性参数的数值化,获得预处理数据;步骤2、利用X均值聚类算法,对应预处理数据,通过循环迭代的方式计算聚类最优解,再根据聚类最优解按照病例进行聚类,获得病例缺陷因素聚类结果集;步骤3、对病例缺陷因素聚类结果集进行分类计算,获得病例参数值,再根据病例参数值,利用病例质量模型计算出病例质量分数;步骤4、根据病例质量分数,通过病例优良率公式计算出医疗单位的医疗质量分数,最后通过划分医疗质量分数等级完成医疗质量评价。

【技术特征摘要】
1.一种面向医疗质量评价的大数据挖掘方法,其特征在于,包括以下步骤,步骤1、对源数据进行噪声处理,再根据数据库,完成源数据的数据格式化和对应源数据属性参数的数值化,获得预处理数据;步骤2、利用X均值聚类算法,对应预处理数据,通过循环迭代的方式计算聚类最优解,再根据聚类最优解按照病例进行聚类,获得病例缺陷因素聚类结果集;步骤3、对病例缺陷因素聚类结果集进行分类计算,获得病例参数值,再根据病例参数值,利用病例质量模型计算出病例质量分数;步骤4、根据病例质量分数,通过病例优良率公式计算出医疗单位的医疗质量分数,最后通过划分医疗质量分数等级完成医疗质量评价。2.根据权利要求1所述的一种面向医疗质量评价的大数据挖掘方法,其特征在于,所述的步骤1包括如下步骤,步骤1.1、将源数据中的红字相冲或数据逻辑错误进行噪声清洗处理;步骤1.2、根据数据库,将1.1处理后的数据进行数据格式化和对应源数据属性参数的数值化,获得预处理数据。3.根据权利要求1所述的一种面向医疗质量评价的大数据挖掘方法,其特征在于,所述的步骤2包括如下步骤,步骤2.1、设置参数K值取值范围;步骤2.2、随机选取聚类中心;步骤2.3、将对应的预处理数据分配到各自欧氏距离最近的聚类中心;步骤2.4、再重新计算新的聚类中心;步骤2.5、根据新的聚类中心所属的聚类簇,设置两个子类,再利用贝叶斯...

【专利技术属性】
技术研发人员:段贵多罗光春刘贵松秦科
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1