当前位置: 首页 > 专利查询>周凡专利>正文

一种基于体检报告聚类分析的疾病预测方法技术

技术编号：21895925 阅读：45 留言：0更新日期：2019-08-17 16:06

本发明专利技术公开了一种基于体检报告聚类分析的疾病预测方法。本发明专利技术首先在体检报告上应用聚类算法分类，之后再统计每个类别中老体检报告后续诊断结果所反映的疾病种类及数量，估算同一类中新体检报告体检者患各种疾病的概率，进而进行疾病预测。本发明专利技术使用机器学习中的聚类算法，与传统概率统计处理方法比效果更佳，减轻了人力财力，且充分挖掘了海量体检数据以及数据间的深度联系信息；拓展了疾病预测的方案，使得体检者可以第一时间根据体检数据获得可能患病的信息，给出就诊或健康建议。

A Method of Disease Prediction Based on Cluster Analysis of Physical Examination Report

全部详细技术资料下载

【技术实现步骤摘要】
一种基于体检报告聚类分析的疾病预测方法
本专利技术涉及机器学习及数据分析
，具体涉及一种基于体检报告聚类分析的疾病预测方法。
技术介绍
大数据时代已经到来，智慧医疗产业也在加速试水，体检报告智能化使健康体检有了更加优质、便捷、高效的体验。大数据的利用可对海量数据进行深度加工和挖掘，精细、动态和智慧的管理体检者的健康。健康大数据还提供具备实时知识产出能力的持续学习型基础设施，开发具有预防性、预测性和可参与性的医疗系统。体检报告智能化将能够提供全程健康医疗服务和管理，预测体检者健康隐患，对可能发生的疾病做到提前预警，给予干预和早期特异性治疗，降低患病风险。实现疾病预防诊疗的科学化管理。大数据中包含的信息具有很高的价值。聚类分析将特征相近的空间实体划分为不同的组，使不同组间的差别尽可能大，同一组内的差别尽可能小。聚类分析在心理学研究中、生物学研究中和模式识别以及数据挖掘等领域中都起着重要的作用。K-Medoids是常用的空间聚类算法，利用中心点(Medoids)作为聚类中心，有效排除了K-Means算法中异常值的影响。Kaufman和Rousseeuw在1990年提出的PAM(PartitioningAroundMedoids)被认为是最有效K-Medoids算法之一。k-medoids聚类算法的基本策略是：首先为每个簇随意选择选择一个代表对象；剩余的对象根据其与代表对象的距离分配给近的一个簇。然后反复地用非代表对象来替代代表对象，以改进聚类的质量。PAM利用了贪婪搜索，不一定可以找到最优解，但是比穷尽搜索更快。PAM算法的优势在于：PAM算法比K-平均算...

【技术保护点】
1.一种基于体检报告聚类分析的疾病预测方法，其特征在于，所述方法包括：步骤一，从医院数据库中获取体检报告，以及这些报告所有者的后续诊断结果，组成体检报告数据库。并将数据集划分训练集和测试集；步骤二，运用统计学方法将体检报告依据后续诊断疾病类型分为K类，也即为聚类簇中心数K，可以有多个K值备选；步骤三，针对体检项目的不同数据类型及数量单位，对数据集体检报告各项目数据进行标准化处理，最终得到标准化后的数据矩阵，之后初始化权重参数W；步骤四，用权重参数W和运用欧氏距离公式计算标准化后的数据矩阵间的相异性矩阵D；步骤五，利用聚类算法根据相异性矩阵D进行体检报告的聚类，使得数据集体检报告被分到K个簇；步骤六，根据测试集里面被错误分类的体检报告的数量来计算测试集数据的损失值Ltest大小；步骤七，调整权重参数W后重复步骤四～六，直至损失值Ltest最小，即得到当前K值下的最优聚类模型；步骤八，更换K值，重复步骤五～七，将体检报告聚到K个不同的类别；步骤九，计算每一个K值下的轮廓系数，以及考虑损失值Ltest大小，来确定最佳的聚类个数K，选出最优聚类模型；步骤十，拿需要被分类的没有诊断结果的体检报告...

【技术特征摘要】
1.一种基于体检报告聚类分析的疾病预测方法，其特征在于，所述方法包括：步骤一，从医院数据库中获取体检报告，以及这些报告所有者的后续诊断结果，组成体检报告数据库。并将数据集划分训练集和测试集；步骤二，运用统计学方法将体检报告依据后续诊断疾病类型分为K类，也即为聚类簇中心数K，可以有多个K值备选；步骤三，针对体检项目的不同数据类型及数量单位，对数据集体检报告各项目数据进行标准化处理，最终得到标准化后的数据矩阵，之后初始化权重参数W；步骤四，用权重参数W和运用欧氏距离公式计算标准化后的数据矩阵间的相异性矩阵D；步骤五，利用聚类算法根据相异性...

【专利技术属性】
技术研发人员：周凡，
申请(专利权)人：周凡，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人