The invention discloses a prediction method of medical data based on diabetes include: (1) processing of medical data for each user, getting data integrity; (2) the examination data of complete diabetes as the training sample, the examination data integrity without diabetes as negative training samples using the GBDT+LR model; training, and adjust the model according to the model of the fusion effect, get the final prediction model; (3) the examination data of new users treated as prediction samples to input the final prediction model, the probability of new users get diabetes. The method can help doctors to make better judgments and patients to better understand the risk of their own illness.
【技术实现步骤摘要】
一种基于医疗体检数据的糖尿病预测方法
本专利技术属于大数据医疗领域,具体涉及一种医疗体检数据的糖尿病预测方法。
技术介绍
随着人们生活水平的提高、保健意识的增强,健康体检逐渐成为一种社会时尚,人们已经改变了只有在得病时才去医院的传统观念,定期体检已经被大多数人所接受。因此,医院积累了海量的电子体检数据,使大数据有了用武之地。大数据医疗是当前的一个热点,是指通过大数据相关技术,分析医疗领域的数据并挖掘其中的知识从而大幅度提高医疗服务。在过去的几十年中,大数据已经深深地影响了每一个企业,包括医疗保健行业。如今,大量的数据可以让医疗保健更加高效,更加个性化。今年,世界卫生组织(WHO)发出警告,我国约有1.1亿名糖尿病患者,约占中国成年人总数的1/10。若不尽快采取行动,减少不健康饮食和缺乏运动等生活方式中的危险因素,预计该数字将在2040年增至1.5亿人,给民众健康和社会经济带来严重影响。糖尿病除了对患者及其家人朋友造成身心的伤害,也带来巨大的经济损失。我国每年投入近1734亿人民币(250亿美元)用于糖尿病管理;用于糖尿病的直接医疗支出占中国医疗支出的13%。这些数 ...
【技术保护点】
一种基于医疗体检数据的糖尿病预测方法,包括以下步骤:(1)对每个用户的体检数据进行处理,得到完整的体检数据;(2)将完整的患糖尿病的体检数据作为正训练样本,将完整的未患糖尿病的体检数据作为负训练样本;采用GBDT+LR模型进行训练,并根据模型的效果进行模型调整融合,得到最终预测模型;(3)将处理后的新用户的体检数据作为预测样本输入到最终预测模型,得到新用户的患糖尿病概率。
【技术特征摘要】
1.一种基于医疗体检数据的糖尿病预测方法,包括以下步骤:(1)对每个用户的体检数据进行处理,得到完整的体检数据;(2)将完整的患糖尿病的体检数据作为正训练样本,将完整的未患糖尿病的体检数据作为负训练样本;采用GBDT+LR模型进行训练,并根据模型的效果进行模型调整融合,得到最终预测模型;(3)将处理后的新用户的体检数据作为预测样本输入到最终预测模型,得到新用户的患糖尿病概率。2.根据权利要求1所述基于医疗体检数据的糖尿病预测方法,其特征在于:步骤1的具体步骤为:(1-1)对每个用户的体检数据进行预处理,得到同一格式的体检数据;(1-2)对同一格式的体检数据进行均衡化,得到均衡化的体检数据;(1-3)对均衡化的体检数据进行数据缺失值填充,得到完整的体检数据。3.根据权利要求2所述基于医疗体检数据的糖尿病预测方法,其特征在于:在步骤(1-1)中,进行体检数据预处理的过程为:首先,对体检数据中原生的诊断结果、体检项目名称以及体检项目结果,采用自然语言处理方法进行分析,得到分析结果;然后,对分析结果进一步地清洗和标准化,转换为同一...
【专利技术属性】
技术研发人员:吴健,周立水,顾盼,邱奇波,邓水光,李莹,尹建伟,吴朝晖,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。