当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于多视图双聚类的就医欺诈行为检测方法及系统技术方案

技术编号:26260538 阅读:92 留言:0更新日期:2020-11-06 17:56
本公开提供了一种基于多视图双聚类的就医欺诈行为检测方法及系统,获取就诊信息和人口统计学信息,并对获得的数据进行预处理;根据预处理后得到的医保参保个体的医保就医记录,在参保人集合与就医时间和就医地点信息集合构成的第一视图和参保人集合与药物信息集合组成的第二视图上同时进行双聚类,得到跨视图一致的患者集群作为就医欺诈行为群体;利用双聚类算法,同时引入健康医疗知识库,不仅可以挖掘频繁地在相同时间相同地点就医的可疑患者群体,而且还可以将其中因长期有规律就医导致被误判的正常患者过滤,从而更加精确地识别医保欺诈行为。

【技术实现步骤摘要】
一种基于多视图双聚类的就医欺诈行为检测方法及系统
本公开涉及计算机
,特别涉及一种基于多视图双聚类的就医欺诈行为检测方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
,并不必然构成现有技术。医疗保险制度是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。随着医疗保险事业的蓬勃发展,少数不法人员出于利益考虑,开始了针对医保基金的欺诈行为。本公开专利技术人发现,传统的医保反欺诈工作主要依赖制定规则,首先制定医保欺诈规则,基于规则对参保人的就医行为进行鉴别,并确定欺诈人及其欺诈行为;这种方式高度依赖专家的经验,一般都是在欺诈行为发生之后,才能制定相应的规则,无法快速高效地识别医保欺诈行为。本公开专利技术人还发现,目前存在异常共现就医欺诈行为,该行为具体是指,有一些欺诈者,通过某种方式收集获取多名参保人的医保卡,利用这些医保卡购买药品然后倒卖,骗取医保基金,这些欺诈者为了降低欺诈成本,通常会在一次欺诈行为中使用多张医保卡购买药品。针对上述行为,以往的异常共现就医欺诈行为识别方法,仅仅考虑挖掘频繁地在相同时间相同地点就医的可疑患者群体,而没有考虑部分正常患者因长期有规律就医导致被误判的情形,因此检测结果不够准确。
技术实现思路
为了解决现有技术的不足,本公开提供了一种基于多视图双聚类的就医欺诈行为检测方法及系统,利用双聚类算法,同时引入健康医疗知识库,不仅可以挖掘频繁地在相同时间相同地点就医的可疑患者群体,而且还可以将其中因长期有规律就医导致被误判的正常患者过滤,从而更加精确地识别医保欺诈行为。为了实现上述目的,本公开采用如下技术方案:本公开第一方面提供了一种基于多视图双聚类的就医欺诈行为检测方法。一种基于多视图双聚类的就医欺诈行为检测方法,包括以下步骤:获取就诊信息和人口统计学信息,并对获得的数据进行预处理;根据预处理后得到的医保参保个体的医保就医记录,构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图;在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类,得到跨视图一致的患者集群作为就医欺诈行为群体。本公开第二方面提供了一种基于多视图双聚类的就医欺诈行为检测系统。一种基于多视图双聚类的就医欺诈行为检测系统,包括:数据获取模块,被配置为:获取就诊信息和人口统计学信息,并对获得的数据进行预处理;数据处理模块,被配置为:根据预处理后得到的医保参保个体的医保就医记录,构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图;就医欺诈判断模块,被配置为:在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类,得到跨视图一致的患者集群作为就医欺诈行为群体。本公开第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的基于多视图双聚类的就医欺诈行为检测方法中的步骤。本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的基于多视图双聚类的就医欺诈行为检测方法中的步骤。与现有技术相比,本公开的有益效果是:1、本公开所述的方法、系统、介质及电子设备,利用双聚类算法,同时引入健康医疗知识库,不仅可以挖掘频繁地在相同时间相同地点就医的可疑患者群体,而且还可以将其中因长期有规律就医导致被误判的正常患者过滤,从而更加精确地识别医保欺诈行为。2、本公开所述的方法、系统、介质及电子设备,不仅考虑多张医保卡频繁同时同地消费这一特征,挖掘频繁地在相同时间和相同地点就医的可疑患者群体,还能够过滤因长期有规律就医导致被误判的正常患者,从而更加精确地识别医保欺诈行为,相较于传统方法的识别准确率为76%,本公开将识别准确率提升至95%,本公开有助于识别异常共现就医欺诈行为,有效保护医疗保险基金。附图说明构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。图1为本公开实施例1提供的基于双聚类的多视图异常共现就医欺诈行为识别方法的流程图;图2为本公开实施例1提供的基于双聚类算法在多个视图上挖掘跨视图一致聚类患者的模型图。具体实施方式下面结合附图与实施例对本公开作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。实施例1:如图1所示,本公开实施例1提供了一种基于双聚类的多视图异常共现就医欺诈行为识别方法,基于双聚类算法,同时引入健康医疗知识库,在多个视图上挖掘频繁地在相同时间相同地点就医,并且医药处方相似的可疑患者群体;因为将其中因长期有规律就医导致被误判的正常患者过滤,所以更加精确地获得欺诈患者。具体包括以下步骤:步骤(1):就诊信息和人口统计学信息获取步骤。获取病人的就诊信息,所述的就诊信息主要包括:患病数据、用药数据、诊疗数据;获取病人的人口统计学信息,所述的人口统计学信息主要包括病人的年龄、性别、人员类别、婚姻、文化水平、职业和居住地等;就诊信息在获取时可利用通信手段从医疗系统获取。步骤(2):数据预处理步骤。用MD5算法对敏感数据如身份证号信息、姓名、家庭住址等信息进行消密处理,即将敏感数据处理成没有意义的字符串,避免使用数据时敏感信息泄露;在医疗数据中,缺失数据是不能被填充的,所以要对缺失率高于设定阈值的数据进行删除。依据国际疾病分类标准编码ICD-10,将就诊信息中的疾病诊断代码转换为对应的国际疾病分类标准编码ICD-10中的疾病代码。依据《中国药典》(2015年版),将就诊信息中的药物编码转换为对应的《中国药典》(2015年版)中的药物代码。步骤(3):根据医保参保人的医保就医记录,构建P-TL-M图。其中,图中有两类节点,P代表医保就医记录中医保参保人的集合;TL代表医保就医记录中就医时间就医地点信息的集合,由<就医时间,就医地点&g本文档来自技高网
...

【技术保护点】
1.一种基于多视图双聚类的就医欺诈行为检测方法,其特征在于,包括以下步骤:/n获取就诊信息和人口统计学信息,并对获得的数据进行预处理;/n根据预处理后得到的医保参保个体的医保就医记录,构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图;/n在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类,得到跨视图一致的患者集群作为就医欺诈行为群体。/n

【技术特征摘要】
1.一种基于多视图双聚类的就医欺诈行为检测方法,其特征在于,包括以下步骤:
获取就诊信息和人口统计学信息,并对获得的数据进行预处理;
根据预处理后得到的医保参保个体的医保就医记录,构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图;
在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类,得到跨视图一致的患者集群作为就医欺诈行为群体。


2.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法,其特征在于,所述异构加权图包括医保参保个体与药物之间相连的边以及医保参保个体与就医时间和就医地点之间的边,每条边对应有相应的权重。


3.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法,其特征在于,通过第一矩阵表示第一视图,通过第二矩阵表示第二视图,所述第一矩阵和第二矩阵的行数均为医保参保个体集合中包含的元素数目,第一矩阵的列数为就医时间和就医地点信息集合中包含的元素数目,第一矩阵的列数为药物集合中包含的元素数目,第一矩阵和第二矩阵中的元素为对应的权重值。


4.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法,其特征在于,双聚类的目标函数,具体为:



其中,Bn表示所有长度为n的二进制向量集合,lω和是提前定义的超参,向量ω用于使不同视图的行聚集结果相同,向量wk表示相应视图中的权重,diag(.)表示以相应向量为对角线元素的对角矩阵,d表示视图数量,n维向量uk和r维向量vk分别代表矩阵Xk经过矩阵分解后得到的左、右向量,k=1,...,d,ω∈Bn。


5.如权利要求4所述的基...

【专利技术属性】
技术研发人员:郭伟李瑞璨李晖闫中敏崔立真
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1