一种医保诈骗行为检测方法和装置制造方法及图纸

技术编号:21201711 阅读:26 留言:0更新日期:2019-05-25 01:46
本发明专利技术实施例提供了一种医保诈骗行为检测方法和装置,其中,该方法包括:确定多个待分析医疗账单数据,待分析医疗账单数据包括多个评价指标;将多个待分析医疗账单数据进行划分得到多个数据子集;针对各个数据子集,确定该数据子集对应的子集权重集;并根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员;确定所有待分析医疗账单数据构成的全集对应的全集权重集;根据全集权重集对所有聚类成员进行融合;确定进行融合后得到的孤立待分析医疗账单数据,并将孤立待分析医疗账单数据作为可疑医疗账单数据。如此,能够减轻人工工作量。

A Detection Method and Device for Medical Insurance Fraud

The embodiment of the present invention provides a detection method and device for medical insurance fraud, which includes: determining multiple data of medical bills to be analyzed, including multiple evaluation indicators; dividing multiple data of medical bills to be analyzed into multiple data subsets; determining the corresponding subset weight set for each data subset; According to the weight set of the subset corresponding to the data subset, the data subset including the medical bills to be analyzed is clustered, and the corresponding clustering members of the data subset are obtained; the complete set of weights corresponding to the complete set of medical bills to be analyzed is determined; all clustering members are fused according to the complete set of weights; and the isolated to be analyzed after the fusion is determined. The data of medical bills are isolated from the data of medical bills to be analyzed as suspicious medical bills. In this way, the workload can be reduced.

【技术实现步骤摘要】
一种医保诈骗行为检测方法和装置
本专利技术涉及计算机
,特别是涉及一种医保诈骗行为检测方法和装置。
技术介绍
众所周知,我国现行的医疗补助力度是非常大的,人民的医保福利水平也在日益提高,与此同时,一些医保体系中的问题也日益显著,其中焦点问题之一就是医保诈骗行为。关于医保诈骗,主要是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。医保诈骗形成的微观机制则是由于健康和疾病风险的不确定性以及高度专业化的医疗服务,导致消费者和医疗服务的提供者之间信息的严重不对称。这种信息不对称使得医疗服务的供给方缺少内在的成本约束机制和激励机制,产生了诱导性需求,使得医疗费用上涨的趋势必然得不到有效控制。针对现有的医疗骗保事件的调研以及实际数据的分析,医保诈骗行为一般较多地表现以下三个方面:1)单张单据的价格过高:药物单据与医嘱不符(得了小病却开了大量昂贵的药物)、大量购买相同药物等行为造成的高价单据。2)同类型小额帐单出现多次:医患勾结,将一个完整连续的医疗服务项目拆分成多个服务项目分别进行收费、将骗保额度过大的单据拆成多个小药方等导致的短时间内反复多次拿药。3)冒用他人医保卡:使用他人的医保卡来办理自己的医疗保险业务。这些年本应作为公民福利项目的医疗保险被滥用,给国家造成的损失巨大,因此通过参保人员在医院就医后缴费的单据,发现其骗保行为,进行及时追责与后期预防,避免医疗保险基金的损失,成为了现阶段极为重要的问题。针对这些方面已有对医保账单数据处理的多种方式,其中一种方式是通过训练好的模型对医保账单数据进行检测,以得到医保账单数据是否是可疑医疗账单数据,其中,可疑医疗账单数据是可能存在医保诈骗行为的医疗账单数据。现有这种方式中,训练模型的过程中,需要人工对大量的样本医疗账单数据进行标记,具体地,获取多个样本单据,人工对样本单据进行标记,如标记该样本单据是可疑医疗账单数据或者不是可疑医疗账单数据,然后基于标记后的多个样本单据训练用于检测的模型。可以看出,现有这种方式中,标记过程会消耗过多的人力,人工工作量较大。
技术实现思路
本专利技术实施例的目的在于提供一种医保诈骗行为检测方法和装置,以减轻人工工作量。具体技术方案如下:第一方面,本专利技术实施例提供了一种医保诈骗行为检测方法,包括:确定多个待分析医疗账单数据,所述待分析医疗账单数据包括多个评价指标;将多个待分析医疗账单数据进行划分得到多个数据子集;针对各个数据子集,确定该数据子集对应的子集权重集;并根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员;确定所有待分析医疗账单数据构成的全集对应的全集权重集;根据所述全集权重集对所有聚类成员进行融合,其中,所述所有聚类成员由各个数据子集分别对应的聚类成员组成;确定进行融合后得到的孤立待分析医疗账单数据,并将所述孤立待分析医疗账单数据作为可疑医疗账单数据。第二方面,本专利技术实施例提供了一种医保诈骗行为检测装置,包括:第一确定模块,用于确定多个待分析医疗账单数据,所述待分析医疗账单数据包括多个评价指标;划分模块,用于将多个待分析医疗账单数据进行划分得到多个数据子集;第二确定模块,用于针对各个数据子集,确定该数据子集对应的子集权重集;聚类模块,用于根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员;第三确定模块,用于确定所有待分析医疗账单数据构成的全集对应的全集权重集;融合模块,用于根据所述全集权重集对所有聚类成员进行融合,其中,所述所有聚类成员由多个数据子集分别对应的聚类成员组成;第四确定模块,用于确定进行融合后得到的孤立待分析医疗账单数据,并将所述孤立待分析医疗账单数据作为可疑医疗账单数据。本专利技术实施例提供的医保诈骗行为检测方法和装置,在医保诈骗行为检测过程中无需人工进行标注,能够减轻人工工作量。同时,能够提高计算效率。且降低了主观干扰,进一步能够提高计算的准确性。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的医保诈骗行为检测方法的流程示意图;图2为本专利技术实施例中融合过程的流程示意图;图3(a)为本专利技术实施例中子系统示意图;图3(b)为本专利技术实施例中医疗数据采集和整理模块示意图;图3(c)为本专利技术实施例中医疗数据预处理模块示意图;图3(d)为本专利技术实施例中医保诈骗评价指标权重制定模块示意图;图3(e)为本专利技术实施例中聚类成员生成模块示意图;图3(f)为本专利技术实施例中聚类融合模块示意图;图3(g)为本专利技术实施例中医保诈骗结果输出模块示意图;图3(h)为本专利技术实施例中聚类成员存储模块示意图;图4(a)为本专利技术实施例提供的具体实施例的流程示意图;图4(b)为本专利技术具体实施例中数据流向示意图;图5为本专利技术实施例提供的医保诈骗行为检测装置的结构示意图;图6为本专利技术实施例提供的医保诈骗行为检测设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的医保诈骗行为检测方法可以应用于电子设备。具体地,电子设备可以包括终端、服务器、处理器等等。本专利技术实施例提供了一种医保诈骗行为检测方法,如图1所示,可以包括:S101,确定多个待分析医疗账单数据。待分析医疗账单数据包括多个评价指标。评价指标可以包括帐单总价、药物类型、拿药次数、医嘱类型、开具医嘱医生编号、医保手册号、执行科室、执行医生编号、病人死亡标志和/或病人身份证号等等。具体地,确定多个待分析医疗账单数据,可以包括:获取多个原始医疗账单数据;针对各个原始医疗账单数据,对该原始医疗账单数据进行预处理,得到该原始医疗账单数据对应的待分析医疗账单数据。原始医疗账单数据可以为从医院数据库中获取的医疗账单数据。一种可实现方式中,在获取原始医疗账单数据后,还可以包括数据整理的过程,如将从医院数据库中获取的原始医疗账单数据整理成预定格式的数据,以便于后续方便处理。预处理可以包括医疗数据清洗、医疗数据集成、医疗数据降维、医疗数据标准化等一系列操作。S102,将多个待分析医疗账单数据进行划分得到多个数据子集。将多个待分析医疗账单数据划分至多个数据子集。一种可实现方式中,将多个待分析医疗账单数据通过随机抽样的方法产生同等量级的数据子集。如共获取得到150个待分析医疗账单数据,将其中每50个划分至一个数据子集,则可以得到3个数据子集。S103,针对各个数据子集,确定该数据子集对应的子集权重集;并根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账本文档来自技高网
...

【技术保护点】
1.一种医保诈骗行为检测方法,其特征在于,包括:确定多个待分析医疗账单数据,所述待分析医疗账单数据包括多个评价指标;将多个待分析医疗账单数据进行划分得到多个数据子集;针对各个数据子集,确定该数据子集对应的子集权重集;并根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员;确定所有待分析医疗账单数据构成的全集对应的全集权重集;根据所述全集权重集对所有聚类成员进行融合,其中,所述所有聚类成员由各个数据子集分别对应的聚类成员组成;确定进行融合后得到的孤立待分析医疗账单数据,并将所述孤立待分析医疗账单数据作为可疑医疗账单数据。

【技术特征摘要】
1.一种医保诈骗行为检测方法,其特征在于,包括:确定多个待分析医疗账单数据,所述待分析医疗账单数据包括多个评价指标;将多个待分析医疗账单数据进行划分得到多个数据子集;针对各个数据子集,确定该数据子集对应的子集权重集;并根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员;确定所有待分析医疗账单数据构成的全集对应的全集权重集;根据所述全集权重集对所有聚类成员进行融合,其中,所述所有聚类成员由各个数据子集分别对应的聚类成员组成;确定进行融合后得到的孤立待分析医疗账单数据,并将所述孤立待分析医疗账单数据作为可疑医疗账单数据。2.根据权利要求1所述的方法,其特征在于,所述确定该数据子集对应的子集权重集,包括:根据该数据子集中包括的各个待分析医疗账单数据,构建第一评价指标权重函数;根据所述第一评价指标权重函数,通过粒子群优化算法,确定该数据子集对应的子集权重集,其中,所述子集权重集中包括各个评价指标分别对应的第一权重值。3.根据权利要求2所述的方法,其特征在于,所述根据该数据子集对应的子集权重集对该数据子集中包括的待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员,包括:基于各个评价指标,分别确定该数据子集中包括的各个待分析医疗账单数据两两之间的子相似度;分别根据所述子集权重集中包括的各个评价指标分别对应的第一权重值,对基于各个评价指标确定的各个评价指标分别对应的子相似度进行加权,得到各个待分析医疗账单数据两两之间的总相似度;根据所述总相似度,对该数据子集中包括的各个待分析医疗账单数据进行聚类,得到该数据子集对应的聚类成员。4.根据权利要求1所述的方法,其特征在于,所述确定所有待分析医疗账单数据构成的全集对应的全集权重集,包括:根据所述所有待分析医疗账单数据,构建第二评价指标权重函数;根据所述第二评价指标权重函数,通过差分进化算法,确定所述全集对应的全集权重集,其中,所述全集权重集包括各个评价指标分别对应的第二权重值。5.根据权利要求1所述的方法,其特征在于,所述根据所述全集权重集对所有聚类成员进行融合,包括:确定融合策略;基于各个评价指标,分别确定各个聚类中心两两之间的相似度,...

【专利技术属性】
技术研发人员:王红熳张东宁杨放春
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1