基于无监督孤立点检测的医保反欺诈监测分析方法和系统技术方案

技术编号:26379588 阅读:45 留言:0更新日期:2020-11-19 23:48
本发明专利技术提供提供一种基于无监督孤立点检测的医保反欺诈监测分析方法,包括以下步骤:步骤S1,获取参保人的就诊行为特征数据,形成原始样本集;步骤S2,根据原始样本集得到多个参保人就诊行为特征数据集;步骤S3,根据各个参保人就诊行为特征数据集创建相应的孤立树;步骤S4,集成各孤立树构成孤立森林;步骤S5,基于孤立森林建立用于评价参保人就诊行为的评价指标;步骤S6,对于输入的参保人就诊行为特征数据样本,遍历孤立森林的每一棵孤立树,根据得到的评价指标输出检测结果。本发明专利技术提高了对参保人欺诈行为的检测水平,提高了机构工作效率。

【技术实现步骤摘要】
基于无监督孤立点检测的医保反欺诈监测分析方法和系统
本专利技术涉及医保反欺诈监测领域,尤其是一种基于无监督孤立点检测的医保反欺诈监测分析方法。
技术介绍
医疗保险欺诈是公民、法人或者其他组织违反医疗保险管理法规和政策,弄虚作假、隐瞒真实情况等,骗取医疗保险待遇或医疗保险基金的行为。医疗保险基金欺诈案频繁发生,对医疗保险制度运行和发展危害巨大。医疗保险损失巨大,在地区都是亟待解决的难题。医疗保险体系涉及多个利益主体,相对于其他险种而言复杂的多,主要包括医疗供方(医院、药店等)、医疗需方(参保者)、医保管理部门(经办机构和监督机构)。由于涉及的环节多、链条长、风险点多,如果方法基金风险的措施做得不全面,就容易滋生医保欺诈、骗保问题。当前的医保欺诈主体可分为医疗机构的欺诈、参加医疗保险的欺诈(参保人欺诈)和医患合谋欺诈。医疗数据库中包含可靠、透明标准的医疗信息,大数据时代,将所有医疗相关数据,包括患者的诊断治疗信息、就诊记录、个人基本信息、参保情况和药品器械使用信息等数据。利用海量的医疗数据建立有效的医保欺诈预警模型,为医保中心实施监管的工作提供决策支持,是当前要解决的首要任务。医保反欺诈稽查不仅需要大量的人力、物力、财力和时间,还需要持续不断的技术支持。我国当前医保反欺诈的技术还停留在依靠黑名单和规则库监控管理医保基金的安全。黑名单是医保监察管理部门已经查出来的欺诈行为,并将其纳入医保欺诈黑名单里的一种反欺诈技术方法。但这种方法有两个致命的缺陷,一个是后置性,必须在监察人员查处后再将其放入黑名单,缺少提前预警机制。另一个是缺少动态管理,即进入黑名单里的案例,将永久在黑名单里,当该案例行为正常时,缺少机动性管理,将其拉出黑名单。
技术实现思路
本专利技术的目的在于克服现有技术中存在的不足,提供一种基于无监督孤立点检测的医保反欺诈监测分析方法和系统,能够帮助相关机构更好地识别参保人的医保欺诈行为,采用集成思想,提高系统的泛化能力和准确率。本专利技术的第一方面,提供一种基于无监督孤立点检测的医保反欺诈监测分析方法,包括以下步骤:步骤S1,获取参保人的就诊行为特征数据,形成原始样本集;步骤S2,根据原始样本集得到多个参保人就诊行为特征数据集;步骤S3,根据各个参保人就诊行为特征数据集创建相应的孤立树;步骤S4,集成各孤立树构成孤立森林;步骤S5,基于孤立森林建立用于评价参保人就诊行为的评价指标;步骤S6,对于输入的参保人就诊行为特征数据样本,遍历孤立森林的每一棵孤立树,根据得到的评价指标输出检测结果。进一步地,步骤S3具体包括:样本数据集X={x1,x2……xn}为参保人就诊行为特征数据集;其中xi=(xi1,xi2,……,xid);S301,从X中随机抽取个样本点构成X的子集X’放入根节点;S302,从d个维度中随机指定一个维度q,在当前子集中随机产生一个分割点p,min(xij,j=q,xij∈X’)<p<max(xij,j=q,xij∈X’);S303,此分割点p生成一个超平面,将当前数据空间划分为两个子空间:指定维度对应的值小于p的样本点归入左子节点,大于或等于p的样本点归入右子节点;S304,递归S302和S303,直至所有的叶子节点都只有一个样本点或者孤立树已经达到指定的高度。进一步地,评价指标建立如下:对每一个样本xi,令其遍历孤立森林的每一棵孤立树,计算其在孤立森林中的平均路径长度E(h(x))为样本xi在孤立森林中的路径长度的期望;对所有样本的平均路径长度做归一化处理;评价指标的计算公式如下:其中,H(i)为调和数。进一步地,步骤S6中,具体设置一个评价指标阈值,当得到的评价指标大于该评价指标阈值时,判断为参保人的异常行为;相应的参保人为嫌疑参保人。进一步地,步骤S2具体包括:对于原始样本集,当样本数大于样本数阈值时,将原始样本集简单划分为多个参保人就诊行为特征数据集;当样本数不超过样本数阈值时,采用套袋法从原始样本集多次抽取样本得到k个参保人就诊行为特征数据集;k≥2。本专利技术的第二方面,提供一种基于无监督孤立点检测的医保反欺诈监测分析系统,包括:存储器,存储有计算机程序;处理器,用于运行所述计算机程序,所述计算机程序运行时执行如上文所述的方法的步骤。本专利技术的优点在于:1)提高了对参保人欺诈行为的检测水平;医保反欺诈政策和机构完善正在紧锣密鼓筹建中,但医保反欺诈的行为和医保基金的损失仍然居高不下,基于无监督孤立点检测的医保反欺诈监测分析系统采用人工智能算法深度结合参保人欺诈行为数据,实现了反欺诈体系的能力升级;能够将正常参保人行为纳入模型中,扩大参保人检测检查欺诈行为,有效防范参保人医保欺诈发生率,反欺诈效果显著。2)节省了资源成本;以往传统的欺诈检测方法需要耗费大量的人力、财力和时间识别和判断出欺诈行为,在庞大的数据量和丰富的欺诈手段面前,显得尤为不足;基于无监督孤立点检测的医保反欺诈监测分析系统,是以智能化的技术为基础降低参保人欺诈率以及医保基金的损失,并且可以实现反欺诈方案的快速规模化应用复制,为更多的机构和地区提供反欺诈安全服务,改善当前单一的反欺诈策略,促进反欺诈策略向智能化、智慧化演进。3)提高了机构工作效率;以往传统的欺诈检测方法是通过专家经验,或者反欺诈医疗规则库,这种策略的反欺诈有很强的规则性,并且很容易被欺诈者钻空子,效率也不高;基于无监督孤立点检测的医保反欺诈监测分析系统,不仅可以处理批量的数据,还可以应用到不同场景中,使欺诈行为无处遁形。采用系统模型判断,避免因经验或人力不足带来的缺陷,提高工作效率。附图说明图1为本专利技术实施例中的方法流程图。图2为本专利技术实施例中的孤立森林示例图。图3为本专利技术实施例中的正常点路径分割与异常点路径分割对比图。图4为本专利技术实施例中的平均路径长度示意图。图5为本专利技术实施例中的评价指标示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。目前社会保险中的大量医保基金,被很多不法分子钻了空子,利用不正当手段获取医保基金,无形的掠夺病人的救命钱。这些行为不仅恶劣,如果不加整治和管理还会形成恶性循环,不断地侵蚀着医保基金,增加财政负担。相比骗保问题的严重,当前反欺诈的能力显得不足,尤其在一些技术相对落后的一线城市,医保风控体系几乎还是原始的名单类,且名单信息严重缺失。或者利用一些简单的规则拦截,比如一张医保卡一天中不能在5家医院就诊等,拦截精准度和覆盖度都非常有限。基于无监督孤立点检测的医保反欺诈监测分析解决方案的精妙之处是,通过技术手段发现对比出异常数据,给出检测结果,这些异常在模型遍历之下本文档来自技高网
...

【技术保护点】
1.一种基于无监督孤立点检测的医保反欺诈监测分析方法,其特征在于,包括以下步骤:/n步骤S1,获取参保人的就诊行为特征数据,形成原始样本集;/n步骤S2,根据原始样本集得到多个参保人就诊行为特征数据集;/n步骤S3,根据各个参保人就诊行为特征数据集创建相应的孤立树;/n步骤S4,集成各孤立树构成孤立森林;/n步骤S5,基于孤立森林建立用于评价参保人就诊行为的评价指标;/n步骤S6,对于输入的参保人就诊行为特征数据样本,遍历孤立森林的每一棵孤立树,根据得到的评价指标输出检测结果。/n

【技术特征摘要】
1.一种基于无监督孤立点检测的医保反欺诈监测分析方法,其特征在于,包括以下步骤:
步骤S1,获取参保人的就诊行为特征数据,形成原始样本集;
步骤S2,根据原始样本集得到多个参保人就诊行为特征数据集;
步骤S3,根据各个参保人就诊行为特征数据集创建相应的孤立树;
步骤S4,集成各孤立树构成孤立森林;
步骤S5,基于孤立森林建立用于评价参保人就诊行为的评价指标;
步骤S6,对于输入的参保人就诊行为特征数据样本,遍历孤立森林的每一棵孤立树,根据得到的评价指标输出检测结果。


2.如权利要求1所述的基于无监督孤立点检测的医保反欺诈监测分析方法,其特征在于,
步骤S3具体包括:
样本数据集X={x1,x2......xn}为参保人就诊行为特征数据集;其中xi=(xi1,xi2,......,xid);
S301,从X中随机抽取个样本点构成X的子集X’放入根节点;
S302,从d个维度中随机指定一个维度q,在当前子集中随机产生一个分割点p,min(xij,j=q,xij∈X’)<p<max(xij,j=q,xij∈X’);
S303,此分割点p生成一个超平面,将当前数据空间划分为两个子空间:指定维度对应的值小于p的样本点归入左子节点,大于或等于p的样本点归入右子节点;
S304,递归S302和S303,直至所有的叶子节点都只有一个样本点或者孤立树已经达到指定的...

【专利技术属性】
技术研发人员:谢提提王琼李志峰邬正国
申请(专利权)人:江苏云脑数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1