基于机器学习的医保反欺诈方法及系统技术方案

技术编号:35894935 阅读:20 留言:0更新日期:2022-12-10 10:28
本发明专利技术公开了基于机器学习的医保反欺诈方法及系统。该方法将医院中所有医生分为多个第一类别;将在该医院就诊过的所有患者分为多个第二类别;当第一类别和第二类别存在医患关系时,获取医生和患者之间的边值,进而构建第一医患图和第二医患图;基于第一医患图获取每个医生的第一异常概率;根据医疗向量获取每个医生的独立因子进而获取第二异常概率;以第一异常概率和第二异常概率的乘积作为每个医生的异常概率;获取每个患者的异常概率;当异常概率大于预设阈值时,对应的医生或者患者存在异常;当存在异常的医生和患者存在边值,判定存在联合骗保行为。本发明专利技术能够对联合骗保行为进行有效识别,避免医保基金的损失。避免医保基金的损失。避免医保基金的损失。

【技术实现步骤摘要】
基于机器学习的医保反欺诈方法及系统


[0001]本专利技术涉及医保信息处理
,尤其涉及基于机器学习的医保反欺诈方法及系统。

技术介绍

[0002]随着医保的覆盖范围以及相关业务的扩大,医保欺诈问题也日益严重,对医疗保险基金安全形成巨大威胁,危害了人民群众的切身利益。
[0003]为监管医保资金支出,建立了医保反欺诈系统,这些系统主要是由熟知医保业务知识并有反欺诈侦测经验的专家建立的一系列规则库。这类反欺诈系统的规则一般较为简单,比如普通感冒病人的医保报销费用显著超过当地感冒治疗的平均费用时,认为是欺诈。
[0004]另外,随着大数据的发展,在医保反欺诈领域也引入了相关技术,通过对医保大数据进行分析筛选数据异常的患者,识别患者的医保诈骗行为。
[0005]对于专家系统,受限于专家的知识水平,只能对已知的欺诈策略起作用,对未知欺诈手段无法有效识别;对于利用大数据进行骗保行为的识别,通常基于患者的就医信息进行数据评估,无法识别复杂数据问题,比如医生和病人合谋欺诈等场景。

技术实现思路

[0006]本专利技术主要解决现有技术无法对未知欺诈手段无法有效识别,无法识别复杂数据的问题;提供一种基于机器学习的医保反欺诈方法及系统,用于识别医患合谋骗保行为,所采用的技术方案具体如下:第一方面,本专利技术一个实施例提供了一种基于机器学习的医保反欺诈方法,该方法包括以下步骤:获取医院中每个医生的过往诊断经历,用数字表示疾病类型,得到每个医生的诊断集合,基于所有医生的诊断集合将所有医生分为不同的第一类别;获取在该医院就诊过的每个患者的病史,得到患病集合,基于所有患者的患病集合将所有患者分为不同的第二类别;当第一类别和第二类别存在医患关系时,基于医生和患者之间的就诊频率获取医生和患者之间的边值,进而构建对应的医患二分权图,将医生视角的医患二分权图记为第一医患图,将患者视角的医患二分权图记为第二医患图;获取第一医患图中每个医生的边值序列,基于边值序列的归属度获取第一异常概率;将存在边值的医生和患者组成一个二元组,根据医生对患者的诊断结果获取二元组的医疗向量,通过对每个第一类别中所有医疗向量进行因子分析,获取对应医生的独立因子,基于独立因子的归属度获取第二异常概率;以第一异常概率和第二异常概率的乘积作为对应医生的异常概率;根据第二医患图中的边值和医疗向量获取每个患者的异常概率;当异常概率大于预设阈值时,对应的医生或者患者存在异常;当存在异常的医生和患者同时存在边值,判定
存在联合骗保行为。
[0007]优选的,所述将所有医生分为不同的第一类别,包括:计算每两个医生的诊断集合的交集和并集,以交集中的元素数量与并集中的元素数量的比值作为对应两个医生的诊断相近程度,诊断相近程度大于预设的诊断相近阈值的医生为一个第一类别。
[0008]优选的,所述将所有患者分为不同的第二类别,包括:计算每两个患者的患病集合的交集和并集,以交集中的元素数量与并集中的元素数量的比值作为对应两个患者的患病相近程度,患病相近程度大于预设的患病相近阈值的患者为一个第二类别。
[0009]优选的,所述医患关系的判断过程为:以每个第一类别中所有医生的诊断集合的并集作为对应第一类别的第一集合,以每个第二类别中所有患者的患病集合的并集作为对应第二类别的第二集合;当第一集合和第二集合存在交集时,对应的第一类别和第二类别存在医患关系。
[0010]优选的,所述医患二分权图的构建方法为:基于医生视角,获取每个医生诊断过的所有患者的总诊断次数,以每个患者被该医生诊断的次数与所述总诊断次数的比值作为该医生与对应患者之间的第一边值,根据所有第一边值构建所述第一医患图;基于患者视角,获取每个患者在该医院的就诊次数,以该患者被每个医生诊断的次数与所述就诊次数的比值作为该患者和对应医生之间的第二边值,根据所有第二边值构建所述第二医患图。
[0011]优选的,所述第一异常概率的获取步骤包括:对于每个医生,将对应的所有第一边值按照所述第一医患图中的患者顺序排列,组成医生的边值序列;计算边值序列中所有第一边值的平均值,以平均值替换第一边值为零的元素,得到优化边值序列;计算每个优化边值序列与每个同类别其他医生对应的优化边值序列之间的余弦相似度,所有余弦相似度的和即为该优化边值序列在该类别中的归属度,由预设值减去所述归属度得到对应医生的所述第一异常概率。
[0012]优选的,所述第二异常概率的获取步骤包括:计算每个独立因子与同类别其他每个独立因子之间的余弦相似度,所有余弦相似度的和为该独立因子在相应类别中的归属度,由预设值减去每个医生对应的最小归属度得到对应医生的所述第二异常概率。
[0013]优选的,所述患者的异常概率的获取步骤包括:获取第二医患图中每个患者的边值序列,基于边值序列的归属度获取第三异常概率;获取每个患者对应的医疗向量,通过对每个第二类别中所有医疗向量进行因子分析,获取对应患者的独立因子,基于独立因子的归属度获取第四异常概率;以第三异常概率和第四异常概率的乘积作为对应患者的异常概率。
[0014]第二方面,本专利技术另一个实施例提供了一种基于机器学习的医保反欺诈系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于机器学习的医保反欺诈方法的步骤。
[0015]本专利技术实施例至少具有如下有益效果:1、依据医生的边值归属度和独立因子归属度对医生进行异常判断,能够基于医生的行为与同类别其他医生行为的相似程度评估医生的异常概率,当某个医生与患者的接触频率明显异于同类型的其他医生,医疗行为也异于同类型的其他医生,说明该医生行为异常,出现了骗保行为;同样的,根据第二医患图中的边值和医疗向量获取每个患者的异常概率,第二医患图中的边值代表了患者视角的就诊频率,通过患者与医生的接触频率以及患者的就医行为判断患者的异常概率;当异常概率过大时,说明医生或者患者存在异常,如果存在异常的医生和患者同时存在边值,即行为异常的医生和患者之间存在就诊关系,说明两者联合起来进行医保诈骗,判定出现联合骗保行为。将医生患者之间的接触频率同时作为医生和患者异常判断的根据,再结合对应的医疗行为或者就医行为,能够对联合骗保行为进行有效识别,避免医保基金的损失。
[0016]2、分别对医生和患者进行异常判断,对于单独骗保的异常行为同样能够有效识别,使异常评估更加全面完善。
附图说明
[0017]图1为本专利技术一个实施例提供的基于机器学习的医保反欺诈方法的步骤流程图。
[0018]图2为本专利技术一个实施例提供的第一医患图。
[0019]图3为本专利技术一个实施例提供的第二医患图。
具体实施方式
[0020]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种基于机器学习的医保反欺诈方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于机器学习的医保反欺诈方法,其特征在于,包括以下步骤:获取医院中每个医生的过往诊断经历,用数字表示疾病类型,得到每个医生的诊断集合,基于所有医生的诊断集合将所有医生分为不同的第一类别;获取在该医院就诊过的每个患者的病史,得到患病集合,基于所有患者的患病集合将所有患者分为不同的第二类别;当第一类别和第二类别存在医患关系时,基于医生和患者之间的就诊频率获取医生和患者之间的边值,进而构建对应的医患二分权图,将医生视角的医患二分权图记为第一医患图,将患者视角的医患二分权图记为第二医患图;获取第一医患图中每个医生的边值序列,基于边值序列的归属度获取第一异常概率;将存在边值的医生和患者组成一个二元组,根据医生对患者的诊断结果获取二元组的医疗向量,通过对每个第一类别中所有医疗向量进行因子分析,获取对应医生的独立因子,基于独立因子的归属度获取第二异常概率;以第一异常概率和第二异常概率的乘积作为对应医生的异常概率;根据第二医患图中的边值和医疗向量获取每个患者的异常概率;当异常概率大于预设阈值时,对应的医生或者患者存在异常;当存在异常的医生和患者同时存在边值,判定存在联合骗保行为。2.根据权利要求1所述的基于机器学习的医保反欺诈方法,其特征在于,所述将所有医生分为不同的第一类别,包括:计算每两个医生的诊断集合的交集和并集,以交集中的元素数量与并集中的元素数量的比值作为对应两个医生的诊断相近程度,诊断相近程度大于预设的诊断相近阈值的医生为一个第一类别。3.根据权利要求1所述的基于机器学习的医保反欺诈方法,其特征在于,所述将所有患者分为不同的第二类别,包括:计算每两个患者的患病集合的交集和并集,以交集中的元素数量与并集中的元素数量的比值作为对应两个患者的患病相近程度,患病相近程度大于预设的患病相近阈值的患者为一个第二类别。4.根据权利要求1所述的基于机器学习的医保反欺诈方法,其特征在于,所述医患关系的判断过程为:以每个第一类别中所有医生的诊断集合的并集作为对应第一类别的第一集合,以每个第二类别中所有患者的患病集合的并集作为对应第二类别的第二集合;当第一集合和第二集合存在交集时,对应的第一类别和第二...

【专利技术属性】
技术研发人员:王辉金敏玉张羽玄
申请(专利权)人:华信咨询设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1