一种基于决策树模型的医保不规范行为预测方法、系统及存储介质技术方案

技术编号:31308391 阅读:12 留言:0更新日期:2021-12-12 21:32
本发明专利技术涉及计算机技术领域,公开了一种基于决策树模型的医保不规范行为预测方法、系统及存储介质,本方法包括步骤:S1:获取患者的医保数据信息,并将医保数据信息通过预设处理得到训练集和验证集;S2:根据训练集来建立决策树模型;S3:通过贪心算法求解步骤S2中决策树模型参数的次优解,得到预测模型;S4:通过验证集对步骤S3中得到的预测模型进行验证;S5:通过增量更新法对预测模型进行更新。本方法能够通过通过建立决策树模型来对医保不规范行为进行有效的预测。进行有效的预测。进行有效的预测。

【技术实现步骤摘要】
一种基于决策树模型的医保不规范行为预测方法、系统及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种基于决策树模型的医保不规范行为预测方法、系统及存储介质。

技术介绍

[0002]医疗保障作为其中重要一环,为民生提供了重要支撑。随着人民生活的进一步提高,医疗需求越来越大,但由此产生的大量医保数据。在有限的医保人员下,已经很难逐条数据去核实其有效性,合理性,真实性。医保审核面临着巨大的瓶颈。
[0003]医疗保险是我国的一项社会保障项目,是为补偿公民或劳动者因为疾病风险造成的经济损失而建立的一种社会保障制度。通过个人和用人单位缴纳一定的保险金额,当参保人患病就诊产生医疗费用后,医疗保险机构给予患者一定的经济补偿。
[0004]现有的对于医保不规范行为的检测可以分为两个主要分支:非监督学习方法和监督学习方法。其中,非监督学习依赖于异常值分析来发现未标记数据中潜在的异常,但是,离群值检测方法不适用于高度偏斜的数据,例如医疗保险不规范行为数据。监督学习则需要大量标记数据点,包括不规范行为和非不规范行为示例,以实现良好的预测性能,但是,由于缺少领域专家和昂贵的医疗不规范行为调查,可标记的点极少;此外,医疗不规范行为数据集的标签极不平衡,因为通常不会在真实明确公开非不规范行为示例。当缺乏非不规范行为示例时,一类分类(OCC)算法是用于对医疗不规范行为数据进行建模的解决方案,然而,在医疗不规范行为数据集中,OCC方法仍然由于训练点数量不足而导致预测性能不佳。故而,以上对医保不规范行为活动进行检测的非监督学习和监督学习方法都存在不足,不能够对不规范行为行为进行有效的预测。

技术实现思路

[0005]针对上述现有技术的现状,本专利技术所要解决的技术问题在于提供一种基于决策树模型的医保不规范行为预测方法、系统及存储介质,通过建立决策树模型来对医保不规范行为进行有效的预测。
[0006]本专利技术一种基于决策树模型的医保不规范行为预测方法、系统及存储介质,具体的包括以下技术方案:
[0007]一种基于决策树模型的医保不规范行为预测方法,包括步骤:
[0008]S1:获取患者的医保数据信息,并将医保数据信息通过预设处理得到训练集和验证集;
[0009]S2:根据训练集来建立决策树模型;
[0010]S3:通过贪心算法求解步骤S2中决策树模型参数的次优解,得到预测模型;
[0011]S4:通过验证集对步骤S3中得到的预测模型进行验证;
[0012]S5:通过增量更新法对预测模型进行更新。
[0013]进一步地,所述医保数据信息包括:临床诊断信息、ICD编目诊断信息、医保诊断信息、患者地址信息和患者身份信息。
[0014]进一步地,所述步骤S1的预设处理包括:
[0015]S11:按照时间顺序将医保数据按照比例切分为训练集和验证集;所述训练集用于模型训练,所述验证集用于模型选取。
[0016]进一步地,所述步骤S2包括:
[0017]S21:定义决策树模型的回归树:
[0018][0019]其中R
j
是第j个叶节点对应的区域,w
j
是叶节点的预测输出,θ={(R
j
,w
j
):j=1:J},J是叶节点的个数,区域由对应特征维度和切分阈值决定。
[0020]进一步地,所述步骤S3包括:
[0021]S31:对多棵决策树的预测结果进行平均;
[0022][0023]其中,f
m
(y|x)是第m棵树。
[0024]一种存储介质,所述存储介质存储有计算机程序,所述计算机程序能够被执行以用于实现所述的基于决策树模型的医保不规范行为预测方法。
[0025]一种基于决策树模型的医保不规范行为预测系统,包括:
[0026]获取模块:用于获取患者的医保数据信息,并将医保数据信息通过预设处理得到训练集和验证集;
[0027]建立模块:根据训练集来建立决策树模型;
[0028]求解模块:通过贪心算法求解建立模块中决策树模型参数的次优解,得到预测模型;
[0029]验证模块:通过验证集对求解模快中得到的预测模型进行验证;
[0030]更新模块:通过增量更新法对预测模型进行更新。
[0031]进一步地,所述获取模块的预设处理包括:
[0032]划分单元:用于按照时间顺序将医保数据按照比例切分为训练集和验证集;所述训练集用于模型训练,所述验证集用于模型选取。
[0033]进一步地,所述建立模块包括:
[0034]定义单元:定义决策树模型的回归树:
[0035][0036]其中R
j
是第j个叶节点对应的区域,w
j
是叶节点的预测输出,θ={(R
j
,w
j
):j=1:J},J是叶节点的个数,区域由对应特征维度和切分阈值决定。
[0037]进一步地,所述求解模块包括:
[0038]平均单元:用于对多棵决策树的预测结果进行平均;
[0039][0040]其中,f
m
(y|x)是第m棵树。
[0041]本专利技术采用上述技术方案包括以下有益效果:
[0042]本专利技术在给出医保数据不规范行为与否判断的同时,提供可解释性的结果,可以根据划分过程,自动填补数据中的缺失值。同时为防止单模型可能造成的模型偏差,利用集成学习的方法,结合多个决策树模型,提高模型的稳定性,从而对医保不规范行为进行有效的预测。
附图说明
[0043]图1为本专利技术实施例一提供的基于决策树模型的医保不规范行为预测方法流程图一;
[0044]图2为本专利技术实施例一提供的基于决策树模型的医保不规范行为预测方法流程图二;
[0045]图3为本专利技术实施例二提供的基于决策树模型的医保不规范行为预测系统结构图一;
[0046]图4为本专利技术实施例二提供的基于决策树模型的医保不规范行为预测系统结构图二
[0047]图5为本专利技术实施例一提供的基于决策树模型的医保不规范行为预测方法的决策树的构建示意图;
[0048]图6为本专利技术实施例一提供的基于决策树模型的医保不规范行为预测方法的决策树输入空间切分过程示意图。
具体实施方式
[0049]以下是本专利技术的具体实施例并结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。
[0050]实施例一
[0051]本实施例提供了一种基于决策树模型的医保不规范行为预测方法,如图1 和图2所示,本方法包括步骤:S1:获取患者的医保数据信息,并将医保数据信息通过预设处理得到训练集和验证集;S2:根据训练集来建立决策树模型; S3:通过贪心算法求解步骤S2中决策树模型参数的次优解,得到预测模型; S4:通过验证集对步骤S3中得到的预测模型进行验证;S5:通过增量更新法对预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树模型的医保不规范行为预测方法,其特征在于,包括步骤:S1:获取患者的医保数据信息,并将医保数据信息通过预设处理得到训练集和验证集;S2:根据训练集来建立决策树模型;S3:通过贪心算法求解步骤S2中决策树模型参数的次优解,得到预测模型;S4:通过验证集对步骤S3中得到的预测模型进行验证;S5:通过增量更新法对预测模型进行更新。2.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法,其特征在于,所述医保数据信息包括:临床诊断信息、ICD编目诊断信息、医保诊断信息、患者地址信息和患者身份信息。3.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法,其特征在于,所述步骤S1的预设处理包括:S11:按照时间顺序将医保数据按照比例切分为训练集和验证集;所述训练集用于模型训练,所述验证集用于模型选取。4.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法,其特征在于,所述步骤S2包括:S21:定义决策树模型的回归树:其中R
j
是第j个叶节点对应的区域,w
j
是叶节点的预测输出,θ={(R
j
,w
j
):j=1:J},J是叶节点的个数,区域由对应特征维度和切分阈值决定。5.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法,其特征在于,所述步骤S3包括:S31:对多棵决策树的预测结果进行平均;其中,f
m
(y|x)是第m棵树。6.一种存储介质,其特征在于,所述存储介...

【专利技术属性】
技术研发人员:俞建东王建军
申请(专利权)人:宁波柠清信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1