基于lasso回归预测治疗费用的方法技术

技术编号:26972105 阅读:33 留言:0更新日期:2021-01-06 00:03
本发明专利技术公开了一种基于lasso回归预测治疗费用的方法,所述方法中,获取电子病历样本,基于样本的变量的离散、线性分布将样本数据转换成数值数据以生成电子病历的数值特征;比较变量的缺失程度,将缺失程度较高的变量删除,然后对缺失程度较低的变量采用聚类方法估算插值,选取k个距离当前变量最近的变量,将距离值设置为权重值,通过加权插值估算缺失值,得到病历数据集;根据数据的正态分布对模型权重进行自适应调整,通过在迭代过程中根据变量分布位置分配正态函数的权重形成模型;数据输入模型进行训练得到预测结果。

【技术实现步骤摘要】
基于lasso回归预测治疗费用的方法
本专利技术属于数据预测
,特别是一种基于lasso回归预测治疗费用的方法。
技术介绍
目前医疗保障体系存在“一刀切”、报销比例不合理等问题,在这种情况下,医院为盈利或免亏会出现少开药、滥检查和医院不愿收治慢性病等需长期住院治疗的重症患者的现象。精准预测病人治疗费用,能够对按病情报销的医疗改革方向提供重要的数据基础,促进医疗改革的合理性;能够为院方资源配置与规划提供数据支撑,也能够为病人选择治疗方案提供参考;还能为保险公司成立保险项目,提供相关疾病数据基础。长期以来,我国有不少医疗费用的相关研究,但仍存在定性研究多,用数学方法进行精确研究较少的问题,在应用数学的方法中,又以研究病人发病率居多,研究病人治疗费用较少。目前,针对病人电子病历进行相关预测普遍存在以下问题:(1)病人入院电子病历的文本数据比例偏高,且病历出自医生导致格式和内容不统一,因此如何有效的从病历中提取关键信息便成为了预测的重要前提;(2)由于病历数据来源于某医院,因此数据量整体偏小。在得到预测数据后,需根据数据特性选取合适的模型本文档来自技高网...

【技术保护点】
1.一种基于lasso回归预测治疗费用的方法,所述方法包括以下步骤:/n第一步骤中,获取电子病历样本,基于样本的变量的离散、线性分布将样本数据转换成数值数据生成电子病历的数值特征,作为费用预测的数据集;/n第二步骤中,比较变量的缺失程度,将缺失程度较高的变量删除,然后对缺失程度较低的变量采用聚类方法估算插值,选取距离缺失值最近的k个变量,将k个距离值设置为权重值,通过加权插值方法估算缺失的变量值,得到病历数据集;/n第三步骤中,基于1范数与2范数的变量筛选公式为

【技术特征摘要】
1.一种基于lasso回归预测治疗费用的方法,所述方法包括以下步骤:
第一步骤中,获取电子病历样本,基于样本的变量的离散、线性分布将样本数据转换成数值数据生成电子病历的数值特征,作为费用预测的数据集;
第二步骤中,比较变量的缺失程度,将缺失程度较高的变量删除,然后对缺失程度较低的变量采用聚类方法估算插值,选取距离缺失值最近的k个变量,将k个距离值设置为权重值,通过加权插值方法估算缺失的变量值,得到病历数据集;
第三步骤中,基于1范数与2范数的变量筛选公式为其中,ωj为模型权重参数,α为回归模型中1范数权重,λ为正则化系数,根据数据的正态分布对模型权重进行自适应调整,调整其中,x为变量值,ω为模型参数,σ为数据集分布的对称轴,在迭代过程中根据变量分布位置分配正态函数的权重;
第四步骤中,数据输入模型进行训练,之后通过测试集对模型预测精度进行验证。


2.根据权利要求1所述的方法,其中,优选的,第一步骤中,将所述电子病历按照病种进行分类,基于分类后的文本电子病历数值化,生成电子病历的数据集。


3....

【专利技术属性】
技术研发人员:佟丽莉谷金波刘广宣金硕巍
申请(专利权)人:辽宁省肿瘤医院
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1