医疗保险团伙欺诈监测方法、系统及存储介质技术方案

技术编号:26479983 阅读:24 留言:0更新日期:2020-11-25 19:25
本发明专利技术提供一种医疗保险团伙欺诈监测方法,该方法包括以下步骤:步骤S1,生成患者的分析数据集;步骤S2,计算患者间的相似度;步骤S3,挖掘互为高度相似的极大群体‑‑‑团伙;步骤S4,根据团伙成员的就诊明细人工审查并判断可疑团伙。本发明专利技术还提出一种医疗保险团伙欺诈监测系统,包括:存储器,存储有计算机程序;处理器,用于运行所述计算机程序,所述计算机程序运行时执行如上文中除了步骤S4之外的方法的步骤。本发明专利技术便于精准高效的识别出存在医疗保险基金欺诈违法违规行为的异常群体。

【技术实现步骤摘要】
医疗保险团伙欺诈监测方法、系统及存储介质
本专利技术涉及医疗保险基金欺诈骗保与反欺诈领域,尤其是一种医疗保险团伙欺诈监测方法及系统。
技术介绍
目前,我国医保反欺诈领域的应用系统主要是通过总结实际业务中已发生的欺诈案件建立规则库,随着时间的推移,欺诈行为的模式越来越复杂多样,固化的规则库很难再去识别新的欺诈行为。且由专家定义的欺诈检测规则来圈定疑似欺诈行为,规则中阈值、权重的选择非常困难,而且治疗中诊断治疗专业性强、欺诈行为相对隐蔽,按照规则一刀切的欺诈检测方式也存在一定的不合理性使得准确率极低。现实中,由于欺诈行为的隐蔽性、行为主体的复杂性,欺诈案件的高发性、多样性,以及医保部门反欺诈能力的局限性,都使得对欺诈行为的直观判断是非常困难的,直接筛选欺诈行为案件更是难上加难。但是从大数据的背景来说,任何主体的欺诈行为都必然记录在医保数据当中,医保领域内的数据管理系统中记录着每一个行为人的医疗机构的数据,因此可以借助专业的数据分析技术从就诊行为中找寻潜在的医保欺诈行为规律,形成模式进行预判,用于医疗服务行为检测,发现欺诈行为的存在,避免医疗保险基金的损失。总体来说,医保欺诈行为监测具有非常重要的作用和意义,利用大数据挖掘算法,挖掘数据背后隐藏的规律,通过构建医疗欺诈行为智能监测模型的方式,精准识别出存在医疗保险基金欺诈违法违规行为的群组,以实现:(1)查出医疗保险基金的不正当使用,减少医疗保险基金无意义的浪费。(2)有针对有范围的缩小嫌疑欺诈行为,提高工作效率。(3)找寻业务规则以外的潜在隐蔽的欺诈行为。在利益的驱动下,骗保欺诈案件高频发生,以前仅是参保人的个人违规行为也逐渐发展成当下有组织的团伙诈骗的违法行为。在当前的医保欺诈中,团伙欺诈往往涉及的医保基金数额巨大,例如违法组织通过收购众多参保人的医保卡,由个人前往医院代为就医,频繁购买医保统筹范围内的药品。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种医疗保险团伙欺诈监测方法及系统,实现医保基金监测从人工抽单审核向大数据全方位、全流程智能监控的转变,便于精准高效的识别出存在医疗保险基金欺诈违法违规行为的异常群体。第一方面,本专利技术实施例提出一种医疗保险团伙欺诈监测方法,该方法包括以下步骤:步骤S1,生成患者的分析数据集;步骤S2,计算患者间的相似度;步骤S3,挖掘互为高度相似的极大群体---团伙。进一步地,该方法中,用P={p1,p2,…,pm}表示就诊患者的集合,用G={g1,g2,…,gn}表示就诊行为相似的群体,即团伙;且G中任意两个患者个体gi、gj就诊行为高度相似;就诊行为是指一个患者在一次就医时产生的活动;患者p在某时间t、某地点s就医的行为b,记录为b=(p,t,s);地点s包括医生或科室或医院;相似行为是指不同的患者p在某段时间内进行了相同类型的就诊行为;用SB(pi,pj)表示任意两个患者相似行为的集合;步骤S1具体包括:从医院导入患者的就诊数据,提取如下字段:1)就诊日期;2)医院ID和/或科室ID和/或医生ID;3)患者ID;步骤S2具体包括:首先计算相似行为的相似度;相似行为的相似度是用来衡量两个相似行为的相似程度;若bi=(pi,ti,si)与bj=(pj,tj,Sj)是相似行为,则si=sj,|ti-tj|≤T;T为时间间隔;相似行为的相似度的计算公式为:然后计算患者间的相似度,计算公式为:其中,N(pi)表示在某段时间内患者pi的就诊行为数,N(pj)表示在某段时间内患者pj的就诊行为数;步骤S3具体包括:首先根据公式(2)计算出每个患者与其他患者之间的相似度Sim,然后筛选Sim大于患者间相似度阈值的患者,输出高度相似患者的稀疏矩阵;然后根据稀疏矩阵输出患者间的关联网络图谱;关联网络图谱中,用N表示节点的集合;用E表示连接节点之间边的集合;用W表示节点之间的相似程度,则Wij=Sim(pi,pj),pi,pj∈N;有了患者间的关联网络图谱后,再继续挖掘关联网络图谱中互为高度相似的极大群体。更进一步地,该方法中,步骤S3中,所述挖掘关联网络图谱中互为高度相似的极大群体,具体包括:子集是关联网络图谱中一个完全连接的封闭的子图,即子集中任意两个节点都有边连接;用子集来表示一个群体,即子集中任意两个患者之间都相似;如果一个子集不能再通过任意一个或多个节点扩展成更大的子集,则该子集称为极大子集;用一个极大子集来表示一个团伙;根据极大子集的定义可以在患者间的关联网络图谱中定位到团伙,再继续挖掘关联网络图谱中全部极大子集,即找到全部团伙;满足“团伙中至少包含h个成员,每个成员至少有h-1条边”条件的节点的集合,即为h-节点集;用H表示h-节点集,则H={n:n∈N,d(n)≥h-1},d(n)是节点n的度,表示节点n的边数,即H表示的是至少有h-1条边的节点的集合;用MH图表示患者间关联网络图谱中由H中的节点构成的子图;通过在患者间关联网络图谱中寻找满足团伙成员数h的h-节点集H并推导出其MH图,然后在MH图上穷举极大子集即可挖掘出全部团伙。更优地,该方法中,步骤S3中,推导出MH图后,选取节点相似度最高的前X%的节点作为种子节点,在MH图中以种子节点进行基于分区的极大子集枚举,以此获得全部团伙;节点相似度的计算公式为:其中,(1)d(n)表示节点n的度,即节点n的边数;(2)nei(n)表示节n的邻居节点的集合;(3)Wnm表示节点n与其相邻节点m之间的相似度。进一步地,患者间相似度阈值设置为0.8。进一步地,h设定为3~6中任意一个数。进一步地,X%设置为30%。进一步地,步骤S3之后,还包括:步骤S4,根据团伙成员的就诊明细人工审查并判断可疑团伙。第二方面,本专利技术实施例提出一种医疗保险团伙欺诈监测系统,包括:存储器,存储有计算机程序;处理器,用于运行所述计算机程序,所述计算机程序运行时执行如上文中除了步骤S4之外的方法的步骤。第三方面,本专利技术实施例还提出一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被配置为运行时执行如上文中除了步骤S4之外的方法的步骤。本专利技术的优点:1)缩减人工审核成本,提升人工审核效率;事实上,由于欺诈患者只占整个患者群体的一小部分,导致医院海量的医疗明细数据中只有极少量的数据是欺诈行为记录。不管是随机抽查还是按照一定的规则抽取,都有极大的概率使抽出来的患者是正常行为患者。而本专利技术提供的方法,可以通过模型自动从海量的数据中分离出团伙,并输出团伙的就诊行为指标,不仅缩小了嫌疑患者的范围,还提高了人工审核的效率。2)调高人工审核准确率,降低医保基金损失;目前,医保反欺诈领域本文档来自技高网
...

【技术保护点】
1.一种医疗保险团伙欺诈监测方法,其特征在于,该方法包括以下步骤:/n步骤S1,生成患者的分析数据集;/n步骤S2,计算患者间的相似度;/n步骤S3,挖掘互为高度相似的极大群体---团伙。/n

【技术特征摘要】
1.一种医疗保险团伙欺诈监测方法,其特征在于,该方法包括以下步骤:
步骤S1,生成患者的分析数据集;
步骤S2,计算患者间的相似度;
步骤S3,挖掘互为高度相似的极大群体---团伙。


2.如权利要求1所述的医疗保险团伙欺诈监测方法,其特征在于,该方法中,
用P={p1,p2,…,pm}表示就诊患者的集合,用G={g1,g2,…,gn}表示就诊行为相似的群体,即团伙;且G中任意两个患者个体gi、gj就诊行为高度相似;
就诊行为是指一个患者在一次就医时产生的活动;患者p在某时间t、某地点s就医的行为b,记录为b=(p,t,s);地点s包括医生或科室或医院;
相似行为是指不同的患者p在某段时间内进行了相同类型的就诊行为;用SB(pi,pj)表示任意两个患者相似行为的集合;
步骤S1具体包括:
从医院导入患者的就诊数据,提取如下字段:
1)就诊日期;
2)医院ID和/或科室ID和/或医生ID;
3)患者ID;
步骤S2具体包括:
首先计算相似行为的相似度;相似行为的相似度是用来衡量两个相似行为的相似程度;若bi=(pi,ti,si)与bj=(pj,tj,sj)是相似行为,则si=sj,|ti-tj|≤T;T为时间间隔;相似行为的相似度的计算公式为:



然后计算患者间的相似度,计算公式为:



其中,N(pi)表示在某段时间内患者pi的就诊行为数,N(pj)表示在某段时间内患者pj的就诊行为数;
步骤S3具体包括:
首先根据公式(2)计算出每个患者与其他患者之间的相似度Sim,然后筛选Sim大于患者间相似度阈值的患者,输出高度相似患者的稀疏矩阵;
然后根据稀疏矩阵输出患者间的关联网络图谱;关联网络图谱中,用N表示节点的集合;用E表示连接节点之间边的集合;用W表示节点之间的相似程度,则Wij=Sim(pi,pj),pi,pj∈N;
有了患者间的关联网络图谱后,再继续挖掘关联网络图谱中互为高度相似的极大群体。


3.如权利要求2所述的医疗保险团伙欺诈监测方法,其特征在于,该方法中,
步骤S3中,所述挖掘关联网络图谱中互为高度相似的极大群体,具体包括:
子集是关联网络图谱中一个完全连接的封闭的子图,即子集中任意两个节点都有边连接;用子集来表示一个群体,即子集中任意两个患者之...

【专利技术属性】
技术研发人员:王琼邬正国李志峰谢提提胡磊
申请(专利权)人:江苏云脑数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1