【技术实现步骤摘要】
一种基于GBDT的药品患者使用人数的预测方法及系统
本专利技术涉及机器学习中的回归预测领域,特别涉及基于梯度提升迭代决策树(GBDT)的药品患者使用人数的预测方法及系统。
技术介绍
回归预测:回归一词最早是由达尔文的表兄弟FrancisGalton专利技术的。Galton在根据上一年的豌豆种子的尺寸预测下一代豌豆种子的尺寸时首次使用了回归预测。回归的目的是预测数值型的目标值,它的目标是接受连续数据,寻找最适合数据的方程,并能够对特定值进行预测。机器学习中的回归预测包括很多种算法,例如线性回归、Ridge回归、Lasso回归、决策树、随机森林、AdaBoost和GBDT等;GBDT:GBDT(GradientBoostingDecisionTree),梯度提升迭代决策树。GBDT是Boosting算法中的一种,也是目前最流行的机器学习算法中的一种。GBDT是决策树(CART)的加法模型,通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,最终的总分类器是将每轮训练得到的弱分类器加权求和 ...
【技术保护点】
1.一种基于GBDT的药品患者使用人数的预测方法,其特征在于,包括:/nS10、获取多个患者的就诊数据,并进行预处理;所述就诊数据包括:医院信息、科室信息、医生信息、患者性别、年龄、检查检验结果信息、诊断信息和处方信息;其中,所述处方信息包括药品信息;/nS20、对经过预处理后的就诊数据,进行特征选择;/nS30、根据预处理后的就诊数据和选择的特征,生成模型训练所需的数据,分成训练数据和测试数据;/nS40、基于所述训练数据使用GBDT回归算法训练GBDT模型;/nS50、根据训练后的GBDT模型对药品患者使用人数进行预测;所述训练后的GBDT模型在测试数据上的预测结果与真 ...
【技术特征摘要】
1.一种基于GBDT的药品患者使用人数的预测方法,其特征在于,包括:
S10、获取多个患者的就诊数据,并进行预处理;所述就诊数据包括:医院信息、科室信息、医生信息、患者性别、年龄、检查检验结果信息、诊断信息和处方信息;其中,所述处方信息包括药品信息;
S20、对经过预处理后的就诊数据,进行特征选择;
S30、根据预处理后的就诊数据和选择的特征,生成模型训练所需的数据,分成训练数据和测试数据;
S40、基于所述训练数据使用GBDT回归算法训练GBDT模型;
S50、根据训练后的GBDT模型对药品患者使用人数进行预测;所述训练后的GBDT模型在测试数据上的预测结果与真实值的偏差率,低于预设阈值。
2.如权利要求1所述的一种基于GBDT的药品患者使用人数的预测方法,其特征在于,所述步骤S10,包括:
对就诊数据,进行数据清洗、缺失值插补、归为NULL类处理以及对类别特征进行独热编码处理。
3.如权利要求1所述的一种基于GBDT的药品患者使用人数的预测方法,其特征在于,所述步骤S20,包括:
对经过预处理后的就诊数据,采用统计方法和基于GBDT模型进行特征选择。
4.一种基于GBDT的药品患者使用人数的预测系统,其特征在于,包括:
预处理模块,用于获取多...
【专利技术属性】
技术研发人员:沈晓飞,夏天,
申请(专利权)人:中电药明数据科技成都有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。