一种基于决策树模型的医保不规范行为预测方法、系统及存储介质技术方案

技术编号：31308391 阅读：12 留言：0更新日期：2021-12-12 21:32

本发明专利技术涉及计算机技术领域，公开了一种基于决策树模型的医保不规范行为预测方法、系统及存储介质，本方法包括步骤：S1：获取患者的医保数据信息，并将医保数据信息通过预设处理得到训练集和验证集；S2：根据训练集来建立决策树模型；S3：通过贪心算法求解步骤S2中决策树模型参数的次优解，得到预测模型；S4：通过验证集对步骤S3中得到的预测模型进行验证；S5：通过增量更新法对预测模型进行更新。本方法能够通过通过建立决策树模型来对医保不规范行为进行有效的预测。进行有效的预测。进行有效的预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于决策树模型的医保不规范行为预测方法、系统及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种基于决策树模型的医保不规范行为预测方法、系统及存储介质。

技术介绍

[0002]医疗保障作为其中重要一环，为民生提供了重要支撑。随着人民生活的进一步提高，医疗需求越来越大，但由此产生的大量医保数据。在有限的医保人员下，已经很难逐条数据去核实其有效性，合理性，真实性。医保审核面临着巨大的瓶颈。
[0003]医疗保险是我国的一项社会保障项目，是为补偿公民或劳动者因为疾病风险造成的经济损失而建立的一种社会保障制度。通过个人和用人单位缴纳一定的保险金额，当参保人患病就诊产生医疗费用后，医疗保险机构给予患者一定的经济补偿。
[0004]现有的对于医保不规范行为的检测可以分为两个主要分支：非监督学习方法和监督学习方法。其中，非监督学习依赖于异常值分析来发现未标记数据中潜在的异常，但是，离群值检测方法不适用于高度偏斜的数据，例如医疗保险不规范行为数据。监督学习则需要大量标记数据点，包括不规范行为和非不规范行为示例，以实现良好的预测性能，但是，由于缺少领域专家和昂贵的医疗不规范行为调查，可标记的点极少；此外，医疗不规范行为数据集的标签极不平衡，因为通常不会在真实明确公开非不规范行为示例。当缺乏非不规范行为示例时，一类分类(OCC)算法是用于对医疗不规范行为数据进行建模的解决方案，然而，在医疗不规范行为数据集中，OCC方法仍然由于训练点数量不足而导致预测性能不佳。故而，以上对医保不规范行为活动进行检测的非监...

【技术保护点】

【技术特征摘要】
1.一种基于决策树模型的医保不规范行为预测方法，其特征在于，包括步骤：S1：获取患者的医保数据信息，并将医保数据信息通过预设处理得到训练集和验证集；S2：根据训练集来建立决策树模型；S3：通过贪心算法求解步骤S2中决策树模型参数的次优解，得到预测模型；S4：通过验证集对步骤S3中得到的预测模型进行验证；S5：通过增量更新法对预测模型进行更新。2.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法，其特征在于，所述医保数据信息包括：临床诊断信息、ICD编目诊断信息、医保诊断信息、患者地址信息和患者身份信息。3.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法，其特征在于，所述步骤S1的预设处理包括：S11：按照时间顺序将医保数据按照比例切分为训练集和验证集；所述训练集用于模型训练，所述验证集用于模型选取。4.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法，其特征在于，所述步骤S2包括：S21：定义决策树模型的回归树：其中R
j
是第j个叶节点对应的区域，w
j
是叶节点的预测输出，θ＝{(R
j
,w
j
):j＝1:J},J是叶节点的个数，区域由对应特征维度和切分阈值决定。5.根据权利要求1所述的基于决策树模型的医保不规范行为预测方法，其特征在于，所述步骤S3包括：S31：对多棵决策树的预测结果进行平均；其中，f
m
(y|x)是第m棵树。6.一种存储介质，其特征在于，所述存储介...

【专利技术属性】
技术研发人员：俞建东，王建军，
申请(专利权)人：宁波柠清信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人