基于图分析的医保联合欺诈检测方法、装置及设备制造方法及图纸

技术编号:27533678 阅读:33 留言:0更新日期:2021-03-03 11:15
本发明专利技术公开一种基于图分析的医保联合欺诈检测方法、装置及设备,方法包括:根据医保数据建立第一图网络;第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊日期节点T;根据第一图网络依次计算每对参保人员之间的就诊相似度,并根据有参保人员的就诊相似度生成相似度矩阵,以获得第二图网络;使用弱连通组建算法对第二图网络进行简化;利用社区检测算法对简化后的网络进行社区划分,以获得分区结果;对分区结果中的每个社区,在每个社区内计算参保人员节点的聚类系数,并根据所述聚类系统认定可疑社区以及可疑参保人员。本发明专利技术可以通过参数的调整为检测人员提供少量、精确的可疑目标,具有较好的实用价值。价值。价值。

【技术实现步骤摘要】
基于图分析的医保联合欺诈检测方法、装置及设备


[0001]本专利技术涉及计算机
,更具体地,涉及一种基于图分析的医保联合欺诈检测方法、装置及设备。

技术介绍

[0002]医疗保险欺诈是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。
[0003]目前的医保联合欺诈检测主要有如下方案:
[0004](1)传统的医保联合欺诈检测通常是基于规则约束的方法,这种方法需要专家依靠经验,通过定义欺诈规则去识别疑似的欺诈行为。
[0005](2)有监督的机器学习方法将欺诈问题定义成二分类问题,利用医保数据对逻辑回归、贝叶斯网络、决策树等监督学习模型进行训练,利用训练完的模型对未知数据进行预测判断是否欺诈。
[0006](3)基于异常检测的无监督方法可以分为基于分布、基于距离、基于密度和基于聚类这四种类型,其中,前三种方法只能在全局数据中寻找离群点,而基于聚类的方法可以检测局部离群值。这类方法主要通过不同的衡量指标对数据的离群点进行分析,从而找出异常数据。
[0007]以上的方案,可以在一定程度上找出欺诈成员,但是效果都不是很好。
[0008]对于第一种方案来说,定义规则十分耗费人力物力,而且由于定义的规则相对死板,欺诈者会想办法去规避这些规则,这种方法准确率不高且容易在一段时间后失效。
[0009]对于第二种方案来说,它需要对数据进行大量的预处理,不断的去组合数据特征,而且由于医保数据分布很不平衡,仅有少量的欺诈样本供模型学习,结果会导致模型的分类能力表现一般。
[0010]对于第三种方案来说,异常检测只能对表现异常的离群数据样本进行发现,虽然它具有一定的准确率,但是它的条件比较严苛,只适用于患者个体就医行为有明细异常的情况,然而从实际的医保数据来看,多数的欺诈人员就医数据在个体层面,与正常患者并无太大差异,无法直接应用于联合欺诈检测。

技术实现思路

[0011]专利技术人在实施本专利技术的过程通过对少量有欺诈标签的患者的行为进行分析发现,在现实世界中,相比于非欺诈群体患者,联合欺诈患者的行为会表现出异常的就医模式,从图1(a)和图1(b)分析中发现,联合欺诈成员的就医轨迹表现出高度一致,他们会经常在同一时间出现在同一个医疗机构中。这种模式启发了专利技术人通过就医轨迹相似度去建立患者间的关系网络,进而检测欺诈群体患者。
[0012]具体而言,本专利技术实施例提供了一种基于图分析的医保联合欺诈检测方法,包括:
[0013]根据医保数据建立第一图网络;其中,所述第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊日期节点T;
[0014]根据所述第一图网络依次计算每对参保人员之间的就诊相似度,并根据所有参保人员之间的就诊相似度生成相似度矩阵,以获得第二图网络;
[0015]使用弱连通组建算法对所述第二图网络进行简化,获得关系简化后的网络;
[0016]利用社区检测算法对所述简化后的网络进行社区划分,以获得分区结果;
[0017]对分区结果中的每个社区,在每个社区内计算参保人员节点的聚类系数,并根据所述聚类系统认定可疑社区以及可疑参保人员。
[0018]优选地,根据医保数据建立第一图网络具体包括:
[0019]对获取的医保数据进行清洗,按参保人员ID进行信息抽取,将所选参保人员的就诊事件抽取出来;所述就诊事件包含每次就诊的医疗服务机构ID与就诊日期;其中,参保人员ID和就诊事件ID是唯一的,不需要进行去重,就诊日期和医疗服务机构ID属于可重复性的,需要进行去重处理;
[0020]在对所述医保数据处理完成后,按照预定的数据格式建立第一图网络;其中,所述第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊时间节点T;关系类型为:参保人员对应就诊事件;就诊事件对应医疗服务机构节点;就诊事件对应就诊日期。
[0021]优选地,根据所述第一图网络依次计算每对参保人员之间的相似度具体为:
[0022]根据第一图网络获取待计算的两个参保人员的就诊事件,所述就诊事件包括医疗服务机构ID以及就诊日期;
[0023]循环比较两个参保人员的所有就诊事件,得到重复就诊事件的次数r;
[0024]利用(r/A+r/B)/2得到两个参保人员之间的就诊相似度;其中A与B分别为两个参保人员的就诊事件次数。
[0025]优选地,使用弱连通组建算法对所述第二图网络进行简化,获得关系简化后的网络,具体为:
[0026]使用弱连通组建算法对所述第二图网络进行初步的社区划分;其中,连通组建算法会将第二图网络中有连接的节点归为一个社区,通过对参保人员间的社区分布对比分析,得出参数阈值;且在所述参数阈值不断升高时,处于两人及两人以上组成的社区内部成员人数逐步减少。
[0027]优选地,利用社区检测算法对所述简化后的网络进行社区划分,以获得分区结果具体为:
[0028]使用模块度优化算法将简化后的网络的每一个节点划分到周围的社区内部;其中,如果模块度优化算法计算的模块度差值为正,则划分成功,将当前节点并入周围的社区,反之则继续保持当前节点独立;
[0029]将划分成功的节点组成的社区视为一个大节点;
[0030]重复以上步骤,直到网络的结构不再改变,获得分区结果,即得到每个参保人员节点所属社区。
[0031]本专利技术实施例还提供了一种基于图分析的医保联合欺诈检测装置,其包括:
[0032]建立单元,用于根据医保数据建立第一图网络;其中,所述第一图网络的节点包括
参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊日期节点T;
[0033]相似度计算单元,用于根据所述第一图网络依次计算每对参保人员之间的就诊相似度,并根据所有参保人员之间的就诊相似度生成相似度矩阵,获得第二图网络;
[0034]简化单元,用于使用弱连通组建算法对所述第二图网络进行简化,获得简化后的网络;
[0035]划分单元,用于利用社区检测算法对所述简化后的网络进行社区划分,以获得分区结果;
[0036]聚类单元,用于对分区结果中的每个社区,在每个社区内计算参保人员节点的聚类系数,并根据所述聚类系统认定可疑社区以及可疑参保人员。
[0037]优选地,所述建立单元具体用于:
[0038]对获取的医保数据进行清洗,按参保人员ID进行信息抽取,将所选参保人员的就诊事件抽取出来;所述就诊事件包含每次就诊的医疗服务机构ID与就诊日期;其中,参保人员ID和就诊事件ID是唯一的,不需要进行去重,就诊日期和医疗服务机构ID属于可重复性的,需要进行去重处理;
[0039]在对所述医保数据处理完成后,按照预定的数据格式建立第一图网络;其中,所述第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊时间节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图分析的医保联合欺诈检测方法,其特征在于,包括:根据医保数据建立第一图网络;其中,所述第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊日期节点T;根据所述第一图网络依次计算每对参保人员之间的就诊相似度,并根据所有参保人员之间的就诊相似度生成相似度矩阵,以获得第二图网络;使用弱连通组建算法对所述第二图网络进行简化,获得关系简化后的网络;利用社区检测算法对所述简化后的网络进行社区划分,以获得分区结果;对分区结果中的每个社区,在每个社区内计算参保人员节点的聚类系数,并根据所述聚类系统认定可疑社区以及可疑参保人员。2.根据权利要求1所述的基于图分析的医保联合欺诈检测方法,其特征在于,根据医保数据建立第一图网络具体包括:对获取的医保数据进行清洗,按参保人员ID进行信息抽取,将所选参保人员的就诊事件抽取出来;所述就诊事件包含每次就诊的医疗服务机构ID与就诊日期;其中,参保人员ID和就诊事件ID是唯一的,不需要进行去重,就诊日期和医疗服务机构ID属于可重复性的,需要进行去重处理;在对所述医保数据处理完成后,按照预定的数据格式建立第一图网络;其中,所述第一图网络的节点包括参保人员节点P,就诊事件节点D,医疗服务机构节点H以及就诊时间节点T;关系类型为:参保人员对应就诊事件;就诊事件对应医疗服务机构节点;就诊事件对应就诊日期。3.根据权利要求1所述的基于图分析的医保联合欺诈检测方法,其特征在于,根据所述第一图网络依次计算每对参保人员之间的相似度具体为:根据第一图网络获取待计算的两个参保人员的就诊事件,所述就诊事件包括医疗服务机构ID以及就诊日期;循环比较两个参保人员的所有就诊事件,得到重复就诊事件的次数r;利用(r/A+r/B)/2得到两个参保人员之间的就诊相似度;其中A与B分别为两个参保人员的就诊事件次数。4.根据权利要求1所述的基于图分析的医保联合欺诈检测方法,其特征在于,使用弱连通组建算法对所述第二图网络进行简化,获得关系简化后的网络,具体为:使用弱连通组建算法对所述第二图网络进行初步的社区划分;其中,连通组建算法会将第二图网络中有连接的节点归为一个社区,通过对参保人员间的社区分布对比分析,得出参数阈值;且在所述参数阈值不断升高时,处于两人及两人以上组成的社区内部成员人数逐步减少。5.根据权利要求3所述的基于图分析的医保联合欺诈检测方法,其特征在于,利用社区检测算法对所述简化后的网络进行社区划分,以获得分区结果具体为:使用模块度优化算法将简化后的网络的每一个节点划分到周围的社区内部;其中,如果模块度优化算法计算的模块度差值为正,则划分成功,将当前节点并入周围的社区,反之则继续保持当前节点独立;将划分成功的...

【专利技术属性】
技术研发人员:林开标陈瑞聪
申请(专利权)人:厦门理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1