一种k-means聚类糖尿病预警模型的改进方法技术

技术编号：21774721 阅读：43 留言：0更新日期：2019-08-03 22:25

本发明专利技术涉及一种k‑means聚类糖尿病预警模型的改进方法，具体包括以下步骤：步骤1，定义聚类簇数k、领域半径ε，选择样本点xi与样本之间距离之和最大的点作为第一个聚类中心点；步骤2，计算每个样本点与其最近聚类中心的距离之和Sum(D(x))，在Sum(D(x))内取一个随机值Random，计算Random‑＝D(x)，直到Random≤0，选择得到新的聚类中心；步骤3，重复上一步骤直至得到所需k个聚类中心点；步骤4，计算每个样本与聚类中心的距离，依据距离最近来选择相应的簇；步骤5，更新所有聚类中心点；步骤6，得到稳定的各簇中心，代入糖尿病分段函数，得到糖尿病的预警模型，本发明专利技术改进了聚类中心方法，建立了糖尿病分段函数预警模型，提高了糖尿病预警能力，为糖尿病不同阶段的诊断和治疗提供依据。

An improved k-means clustering diabetes early warning model

全部详细技术资料下载

【技术实现步骤摘要】
一种k-means聚类糖尿病预警模型的改进方法
本专利技术涉及医疗信息化
，一种糖尿病预警模型建立方法，从糖尿病患病预警的需求出发，改进k-means聚类方法，建立糖尿病分段函数，具体涉及一种k-means聚类糖尿病预警模型的改进方法。
技术介绍
随着糖尿病患者数量逐年增加、糖尿病并发症越来越多样化，这给糖尿病患者的诊断和治疗带来了巨大挑战。现有的医院信息系统虽有大量糖尿病诊断病例样本，却也只是单纯地做病例存储和简单的统计分析，并没有进一步挖掘其中的规律和知识，因此糖尿病诊断样本利用率较低；同时，已有糖尿病数据集仅有双标签，没有对未患病数据进行标记，难以实现健康人群的预警。因此，迫切需要开展糖尿病预警模型研究，提高糖尿病的预防和治疗效果，提升人们的健康水平。现有技术：非专利文献[1]：刘荣凯,孙忠林.针对K-means初始聚类中心优化的PCA-TDKM算法[J].软件导刊,2018,17(09):85-87.提出了PCATDKM算法在传统的Kmeans算法中增加了PCA、TD与最大最小距离算法。PCA算法能够对数据对象集合进行降维，加速聚类过程。TD算法能够在选择初始聚类中心时根据数据对象的实际分布情况进行动态选择，使得通过聚类算法得到的初始k个聚类中心与实际聚类相对应。非专利文献[2]：YuanQL,ShiHB,ZhouXF.AnoptimizedinitializationcenterK-meansclusteringalgorithmbasedondensity[C]//IEEEInternationalConferenceonCyberTec...

【技术保护点】
1.一种k‑means聚类糖尿病预警模型的改进方法，其特征在于，包括如下步骤：步骤1，第一个聚类中心点的选择；步骤2，选择得到新的聚类中心；步骤3，遍历操作，重复上步骤2直至得到所需k个中心点；步骤4，簇标记；步骤5，更新操作，更新所有聚类中心点；步骤6，得到稳定的各簇中心，代入糖尿病分段函数，得到糖尿病的预警模型。

【技术特征摘要】
1.一种k-means聚类糖尿病预警模型的改进方法，其特征在于，包括如下步骤：步骤1，第一个聚类中心点的选择；步骤2，选择得到新的聚类中心；步骤3，遍历操作，重复上步骤2直至得到所需k个中心点；步骤4，簇标记；步骤5，更新操作，更新所有聚类中心点；步骤6，得到稳定的各簇中心，代入糖尿病分段函数，得到糖尿病的预警模型。2.根据权利要求1所述k-means聚类糖尿病预警模型的改进方法，其特征在于，所述步骤1中第一个聚类中心点的选择，是对初始聚类中心的选择进行改进，使其落在各簇类的中心部位，定义聚类簇数为k、领域半径为ε，计算每一个点与第一个聚类中心点的距离dist(x)，选取dist(x)较大的点作为新的聚类中心，对每一个dist(x)求和得到：sumi＝sumi+disti式中，i为聚类中心个数；最大的Sum(dist(x))为第一个聚类中心点，即：sum_max＝max(sumi)。3.根据权利要求2所述k-means聚类糖尿病预警模型的改进方法，其特征在于，所述步骤2、步骤3中选择得到新的聚类中心，所述计算每一个点与第一个聚类中心点的距离为dist(x)，选取dist(x)较大的点作为新的聚类中心，即对每...

【专利技术属性】
技术研发人员：高秀娥，陈波，桑海涛，陈世峰，胡玲艳，
申请(专利权)人：岭南师范学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人