【技术实现步骤摘要】
基于健康风险的医疗支出费用预测系统
本申请涉及大数据处理
,特别是涉及一种基于健康风险的医疗支出费用预测系统。
技术介绍
随着大数据处理技术的日益发展,以及人们生活水平的提高,越来越多人注重健康管理,包括定时进行个人健康检查以及购买相应健康保险等,而个人健康数据和健康保险数据也日益增多。对于医疗保险机构而言,同样需要对医疗保险客户的个人健康状况进行关注,并对与个人健康风险密切关联的医疗费用支出进行预测和估算,实现事前健康风险管理以及特定风险人群的筛选,以降低与医疗保险客户的实际医疗支出对应的理赔费用。传统上,常使用one-hot对分类变量进行编码,其中,one-hot编码又称“独热编码”,是利用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位。但由于这些寄存器位中在任意时候只有一位有效,即表示仅有一个状态,则包含的信息量较少,得到的向量是二进制的、稀疏的且维度较高的向量,无法表述相关词背后的语意,进而也无法体现个人健康风险和医疗支出费用间的关联关系,导致对医疗支出费用的预测结果准确度较低。 ...
【技术保护点】
1.一种基于健康风险的医疗支出费用预测系统,其特征在于,所述系统包括:/n信息离散模块,用于获取用户的个人属性信息和预设周期内的疾病信息,并将所述个人属性信息和所述疾病信息分别进行离散化,得到对应的词单元;/n词向量生成模块,用于根据预设获取时间段内的用户历史属性信息构建得到训练文本,并根据所述训练文本训练得到各词单元的词向量;所述词向量包括个人属性信息词向量和疾病信息词向量;/n个人健康风险预测模型构建模块,用于基于个人属性信息词向量和疾病信息词向量,构建得到个人健康风险预测模型;/n医疗费用支出预测模型训练模块,用于获取预设周期内的实际医疗费用和所述个人健康风险预测模型 ...
【技术特征摘要】
1.一种基于健康风险的医疗支出费用预测系统,其特征在于,所述系统包括:
信息离散模块,用于获取用户的个人属性信息和预设周期内的疾病信息,并将所述个人属性信息和所述疾病信息分别进行离散化,得到对应的词单元;
词向量生成模块,用于根据预设获取时间段内的用户历史属性信息构建得到训练文本,并根据所述训练文本训练得到各词单元的词向量;所述词向量包括个人属性信息词向量和疾病信息词向量;
个人健康风险预测模型构建模块,用于基于个人属性信息词向量和疾病信息词向量,构建得到个人健康风险预测模型;
医疗费用支出预测模型训练模块,用于获取预设周期内的实际医疗费用和所述个人健康风险预测模型的输出结果,并根据所述个人健康风险预测模型的输出结果以及所述预设周期内的实际医疗费用,训练得到医疗费用支出预测模型;
医疗费用支出预测模块,用于根据所述医疗费用支出预测模型,输出得到对应的医疗支出预测费用。
2.根据权利要求1所述的系统,其特征在于,所述词向量生成模块,包括:
用户历史属性信息获取模块,用于获取预设获取时间段内的用户历史属性信息;所述用户历史属性信息可存储于区块链中;
文本数据生成模块,用于将所述用户历史属性信息进行离散化,生成对应的文本数据;
训练文本生成模块,用于将所述文本数据确定为各所述词单元的训练文本;
训练模块,用于根据全局词向量模型对所述训练文本进行训练,生成与各所述词单元对应的词向量。
3.根据权利要求2所述的系统,其特征在于,所述词向量生成模块,还包括:
词单元遍历模块,用于将所述训练文本作为基准,遍历根据离散化得到的个人属性信息词单元和疾病信息词单元;
公共关系检测模块,用于当检测到与所述训练文本存在具有公共性关系的关联词单元时,将各所述关联词单元确定为关联词组;
词向量训练模块,用于基于所述全局词向量模型,训练得到所述关联词组对应的词向量。
4.根据权利要求1所述的系统,其特征在于,所述个人健康风险预测模型构建模块,包括:
个人健康向量生成模块,用于将所述个人属性信息词向量以及预设周期内的疾病信息词向量进行叠加,得到个人健康词向量;所述个人健康词向量用于预测得到该用户在下一预设周期内的疾病信息;
个人健康风险预测模型生成模块,用于将所述个人健康词向量作为输入,将下一预设周期内用户的疾病信息作为输出,对第一原始回归分析模型进行训练,构建得到个人健康风险预测模型。
5.根据权利要求1所述的系统,其特征在于,所述医疗费用支出预测模型训练模块,包括:
患病概率确定模块,用于根据所述个人健康风险预测模型的输出结果,确定用户在下一预设周期内在每个疾病分组中的患病概率;所述疾病分组根据预设的分组器进行划分;
医疗费用支出预测模型生成模块,用于将下...
【专利技术属性】
技术研发人员:陈源,
申请(专利权)人:平安医疗健康管理股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。