个人健康风险评分预测方法及系统技术方案

技术编号:21456335 阅读:21 留言:0更新日期:2019-06-26 05:33
本发明专利技术个人健康风险评分预测方法及系统,包括:采集本年度的基本医疗保险报销数据和对应的参保人信息数据;对基本医保结算数据、基本医保结算明细数据和参保人信息数据进行数据标准化处理,从而获得标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据;基于标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据生成四大类预测因子,基于四大类预测因子生成多个子预测因子;对子预测因子进行特征转换;对子预测因子进行特征降维以减少子预测因子的数量;基于特征选择后的子预测因子建立线性回归模型来预测下一年度的个人医疗支出;基于预测出的下一年度的个人医疗支出来预测下一年度的个人健康风险评分。

【技术实现步骤摘要】
个人健康风险评分预测方法及系统
本专利技术涉及个人健康风险评分
,特别是涉及一种个人健康风险评分预测方法及系统。
技术介绍
基本医保报销数据涵盖了参保人个人信息、疾病信息、就诊行为、医疗支出、社保类型等多领域,且就诊发生率相对于其他保险的发生率来说要高很多,数据颗粒度细,能够用来刻画参保人在医疗健康方面的画像,建立的个人健康风险评分模型可以为实现:-医疗险的定价核保,个人健康风险评分能直接体现下一年度个人医疗费用支出的风险,对消费性的医疗保险能够实现精准核保;-重疾保险的辅助核保,依据健康评分生成黑白名单。对于黑名单,建议拒保和体检,白名单快速核保,提升客户体验,简化核保流程;-高风险人群识别,对个人健康风险评分高的高风险人群,针对其导致评分过高的原因,进行提前干预和管理,能够有效的控制出医疗费用的高速增长。-医院绩效评估,对医院治疗同病种,同健康评分风险等级的病人的次均医疗费用进行横向比较,若某医院的治疗费用明显超出其可对比医院花费的平均值,则该医院存在过度花费,需要进一步通过比较该医院与同等级医院的治疗人群特征、花费项目类型以及具体使用项目深入挖掘,为基金管理确定控费抓手。目前各大保险公司或者研究机构会依据自有的理赔数据,或者公开资源中获取的数据,在个人层面的健康风险的预测上进行研究。不过鉴于数据量的局限性,数据颗粒度的局限性,预测精度上会有不足。
技术实现思路
本专利技术针对现有技术存在的问题和不足,提供一种个人健康风险评分预测方法及系统。本专利技术是通过下述技术方案来解决上述技术问题的:本专利技术提供一种个人健康风险评分预测方法,其特点在于,其包括以下步骤:步骤1、数据采集:采集本年度的基本医疗保险报销数据和对应的参保人信息数据,所述基本医疗保险报销数据包括基本医保结算数据和基本医保结算明细数据;步骤2、数据标准化:对基本医保结算数据、基本医保结算明细数据和参保人信息数据进行数据标准化处理,从而获得标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据;步骤3、特征工程:基于标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据生成四大类预测因子,四大类预测因子包括个人信息、医疗花费、医疗行为和疾病类型,基于四大类预测因子生成多个子预测因子;步骤4、特征转换:对子预测因子进行特征转换;步骤5、特征选择:对转换后的子预测因子进行特征降维以减少子预测因子的数量;步骤6、建立模型:基于特征选择后的子预测因子建立线性回归模型来预测下一年度的个人医疗支出;Y=θ0+θ1*X1+θ2*X2+…+θn*Xn+∈其中,Y表示下一年度的个人医疗支出,θi表示自变量,0≤i≤n,Xj表示特征选择后的子预测因子中的第j个子预测因子,1≤j≤n,n表示特征选择后的子预测因子的数量;步骤7、评估个人健康风险:基于预测出的下一年度的个人医疗支出来预测下一年度的个人健康风险评分;下一年度的个人健康风险评分=预测出的下一年度的个人医疗支出/预测出的下一年度的所有个人医疗支出的平均医疗支出。较佳地,在步骤5和步骤6之间包括:采用机器学习XGBOOST模型对特征选择后的子预测因子的预测能力进行评测。较佳地,在步骤4中,采用impactcoding进行数值型预测因子的特征转换,采用one-hot-encoding进行字符型预测因子的特征转换。较佳地,在步骤5中,采用因子相关性分析分析出转换后的子预测因子中彼此相关的因子,仅仅保留彼此相关的因子中的一个因子,采用XGBOOST算法去除预测力较弱的因子。较佳地,基本医保结算数据包含的字段主要有个人编号,就诊编号,就诊时间,就诊类别,入院/出院时间,诊断编码,诊断名称,科室名称,医疗总金额,医保报销金额,自负金额,大病报销金额,其他报销金额等等;基本医保结算明细数据包含的字段主要有个人编号,就诊编号,结算单号,医保目录编码,医保目录名称,单价,数量,金额,自付比例,自费金额等等;参保人信息数据包含的字段主要有年龄,性别,险种,离退休状态,户口性质,文化程度,政治面貌,工作类型等等。本专利技术提供一种个人健康风险评分预测系统,其特点在于,其包括数据采集模块、数据处理模块、数据生成模块、特征转换模块、特征选择模块、模型建立模块和评估模块;所述数据采集模块用于采集本年度的基本医疗保险报销数据和对应的参保人信息数据,所述基本医疗保险报销数据包括基本医保结算数据和基本医保结算明细数据;所述数据处理模块用于对基本医保结算数据、基本医保结算明细数据和参保人信息数据进行数据标准化处理,从而获得标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据;所述数据生成模块用于基于标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据生成四大类预测因子,四大类预测因子包括个人信息、医疗花费、医疗行为和疾病类型,基于四大类预测因子生成多个子预测因子;所述特征转换模块用于对子预测因子进行特征转换;所述特征选择模块用于对转换后的子预测因子进行特征降维以减少子预测因子的数量;所述模型建立模块用于基于特征选择后的子预测因子建立线性回归模型来预测下一年度的个人医疗支出;Y=θ0+θ1*X1+θ2*X2+…+θn*Xn+∈其中,Y表示下一年度的个人医疗支出,θi表示自变量,0≤i≤n,Xj表示特征选择后的子预测因子中的第j个子预测因子,1≤j≤n,n表示特征选择后的子预测因子的数量;所述评估模块用于基于预测出的下一年度的个人医疗支出来预测下一年度的个人健康风险评分;下一年度的个人健康风险评分=预测出的下一年度的个人医疗支出/预测出的下一年度的所有个人医疗支出的平均医疗支出。较佳地,所述系统还包括一评测模块,所述评测模块用于采用机器学习XGBOOST模型对特征选择后的子预测因子的预测能力进行评测。较佳地,所述特征转换模块用于采用impactcoding进行数值型预测因子的特征转换,采用one-hot-encoding进行字符型预测因子的特征转换。较佳地,所述特征选择模块用于采用因子相关性分析分析出转换后的子预测因子中彼此相关的因子,仅仅保留彼此相关的因子中的一个因子,采用XGBOOST算法去除预测力较弱的因子。较佳地,基本医保结算数据包含的字段主要有个人编号,就诊编号,就诊时间,就诊类别,入院/出院时间,诊断编码,诊断名称,科室名称,医疗总金额,医保报销金额,自负金额,大病报销金额,其他报销金额等等;基本医保结算明细数据包含的字段主要有个人编号,就诊编号,结算单号,医保目录编码,医保目录名称,单价,数量,金额,自付比例,自费金额等等;参保人信息数据包含的字段主要有年龄,性别,险种,离退休状态,户口性质,文化程度,政治面貌,工作类型等等。在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本专利技术各较佳实例。本专利技术的积极进步效果在于:基本医疗保险的报销数据的覆盖时间长,覆盖面积广。个人层面的病史信息,就诊信息,药品信息,使用的检查、诊疗、手术信息更加的全面,大大的提升了个人健康风险评分预测模型的精度。附图说明图1为本专利技术较佳实施例的个人健康风险评分预测方法的流程图。图2为本专利技术较佳实施例的个人健康风险评分预测系统的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,本文档来自技高网...

【技术保护点】
1.一种个人健康风险评分预测方法,其特征在于,其包括以下步骤:步骤1、数据采集:采集本年度的基本医疗保险报销数据和对应的参保人信息数据,所述基本医疗保险报销数据包括基本医保结算数据和基本医保结算明细数据;步骤2、数据标准化:对基本医保结算数据、基本医保结算明细数据和参保人信息数据进行数据标准化处理,从而获得标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据;步骤3、特征工程:基于标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据生成四大类预测因子,四大类预测因子包括个人信息、医疗花费、医疗行为和疾病类型,基于四大类预测因子生成多个子预测因子;步骤4、特征转换:对子预测因子进行特征转换;步骤5、特征选择:对转换后的子预测因子进行特征降维以减少子预测因子的数量;步骤6、建立模型:基于特征选择后的子预测因子建立线性回归模型来预测下一年度的个人医疗支出;Y=θ0+θ1*X1+θ2*X2+…+θn*Xn+∈其中,Y表示下一年度的个人医疗支出,θi表示自变量,0≤i≤n,Xj表示特征选择后的子预测因子中的第j个子预测因子,1≤j≤n,n表示特征选择后的子预测因子的数量;步骤7、评估个人健康风险:基于预测出的下一年度的个人医疗支出来预测下一年度的个人健康风险评分;下一年度的个人健康风险评分=预测出的下一年度的个人医疗支出/预测出的下一年度的所有个人医疗支出的平均医疗支出。...

【技术特征摘要】
1.一种个人健康风险评分预测方法,其特征在于,其包括以下步骤:步骤1、数据采集:采集本年度的基本医疗保险报销数据和对应的参保人信息数据,所述基本医疗保险报销数据包括基本医保结算数据和基本医保结算明细数据;步骤2、数据标准化:对基本医保结算数据、基本医保结算明细数据和参保人信息数据进行数据标准化处理,从而获得标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据;步骤3、特征工程:基于标准基本医保结算数据、标准基本医保结算明细数据和标准参保人信息数据生成四大类预测因子,四大类预测因子包括个人信息、医疗花费、医疗行为和疾病类型,基于四大类预测因子生成多个子预测因子;步骤4、特征转换:对子预测因子进行特征转换;步骤5、特征选择:对转换后的子预测因子进行特征降维以减少子预测因子的数量;步骤6、建立模型:基于特征选择后的子预测因子建立线性回归模型来预测下一年度的个人医疗支出;Y=θ0+θ1*X1+θ2*X2+…+θn*Xn+∈其中,Y表示下一年度的个人医疗支出,θi表示自变量,0≤i≤n,Xj表示特征选择后的子预测因子中的第j个子预测因子,1≤j≤n,n表示特征选择后的子预测因子的数量;步骤7、评估个人健康风险:基于预测出的下一年度的个人医疗支出来预测下一年度的个人健康风险评分;下一年度的个人健康风险评分=预测出的下一年度的个人医疗支出/预测出的下一年度的所有个人医疗支出的平均医疗支出。2.如权利要求1所述的个人健康风险评分预测方法,其特征在于,在步骤5和步骤6之间包括:采用机器学习XGBOOST模型对特征选择后的子预测因子的预测能力进行评测。3.如权利要求1所述的个人健康风险评分预测方法,其特征在于,在步骤4中,采用impactcoding进行数值型预测因子的特征转换,采用one-hot-encoding进行字符型预测因子的特征转换。4.如权利要求1所述的个人健康风险评分预测方法,其特征在于,在步骤5中,采用因子相关性分析分析出转换后的子预测因子中彼此相关的因子,仅仅保留彼此相关的因子中的一个因子,采用XGBOOST算法去除预测力较弱的因子。5.如权利要求1所述的个人健康风险评分预测方法,其特征在于,基本医保结算数据包含的字段主要有个人编号,就诊编号,就诊时间,就诊类别,入院/出院时间,诊断编码,诊断名称,科室名称,医疗总金额,医保报销金额,自负金额,大病报销金额,其他报销金额等等;基本医保结算明细数据包含的字段主要有个人编号,就诊编号,结算单号,医保目录编码,医保目录名称,单价,数量,金额,自付比例,自费金额等等;参保人信息数据包含的字段主要有年龄,性别,险种,离退休状态,户口性质,文化程度,政治面貌,工作类型等等。6.一种个人健康风险评分预测系统,其特征在于,其包括数据采...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:太平洋医疗健康管理有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1