【技术实现步骤摘要】
一种改进k-means聚类的糖尿病预警模型
本专利技术涉及医疗信息化
,尤其涉及一种改进k-means聚类的糖尿病预警模型。
技术介绍
电子病历已经是医院综合信息系统的主要部分,生物技术和健康科学的显着进步已经致使电子健康记录(EHR)产生了大量原始数据,如遗传数据和临床信息指标等。现有的医院信息系统虽有大量糖尿病诊断病例样本,然而只是单纯地做病例存储和简单的统计分析,并没有进一步挖掘其中的规律和知识,因此糖尿病诊断样本利用率较低;同时,已有糖尿病数据集仅有双标签,没有对未患病数据进行标记,难以实现健康人群的预警。目前还没有根治糖尿病的方法,一般是采用一些治疗手段来控制病情的发展。但是糖尿病引起的并发症却是危害人们健康甚至导致死亡的杀手,糖尿病并发症有以下两个特点,一是并发症早期不易发现,且当前的糖尿病诊疗还是以医生的诊疗为主,从医人员根据患者的病征表现、各项身体指标的情况、历史治疗情况等结合医生的自身经验积累得出电子病历的诊疗方法,而且由于电子病历的个体特征存在差异,相似的病情使用相同的诊疗方法往往结果也是迥 ...
【技术保护点】
1.一种改进k-means聚类的糖尿病预警系统,其特征是,该系统包括:/n存储设备;/n基于改进k-means聚类的糖尿病预警模块(1),其耦合到所述存储设备并被配置为:/n基于所选择的第一个聚类中心点,得到稳定的各簇中心,代入糖尿病分段函数,得到糖尿病的预警模型,/n其中,选定数据集,定义聚类簇数k、领域半径ε,选择样本点X
【技术特征摘要】
20190418 CN 20191031423651.一种改进k-means聚类的糖尿病预警系统,其特征是,该系统包括:
存储设备;
基于改进k-means聚类的糖尿病预警模块(1),其耦合到所述存储设备并被配置为:
基于所选择的第一个聚类中心点,得到稳定的各簇中心,代入糖尿病分段函数,得到糖尿病的预警模型,
其中,选定数据集,定义聚类簇数k、领域半径ε,选择样本点Xi与样本之间距离之和最大的点作为第一个聚类中心点,以使得第一个聚类中心点落在各簇类的中心部位。
2.根据权利要求1所述的糖尿病预警系统,其特征是,样本点Xi与样本之间距离之和最大的点的选择是通过以下至少一个步骤来实现的:
计算每一个点与第一个聚类中心点的距离dist(x);
选取dist(x)较大的点作为新的聚类中心;
对每一个dist(x)求和;
最大的Sum(dist(x))为第一个聚类中心点。
3.根据权利要求2所述的糖尿病预警系统,其特征是,所述糖尿病预警模块(1)还被配置为:
选择得到新的聚类中心,
其中,选择样本点Xi与第一个聚类中心点之间距离较大的点作为新的聚类中心。
4.根据权利要求3所述的糖尿病预警系统,其特征是,样本点Xi与第一个聚类中心点之间距离较大的点的选择是通过以下至少一个步骤来实现的:
计算每一个点与第一个聚类中心点的距离dist(x);
选取dist(x)较大的点作为新的聚类中心;
即对每一个dist(x)求和得到Sum(dist(x));
取一个在Sum(dist(x))内的随机值Random;
重复通过公式计算,所述公式为:Random=Random-dist(x);
直至Random≤0,则该点为下一个聚类中心点。
5.根据权利要求4所述的糖尿病预警系统,其特征是,所述糖尿病预警模块(1)还被配置为:
遍历操作,其中...
【专利技术属性】
技术研发人员:高秀娥,陈波,桑海涛,陈世峰,谢文学,
申请(专利权)人:岭南师范学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。