一种基于多视图双聚类的就医欺诈行为检测方法及系统技术方案

技术编号：26260538 阅读：92 留言：0更新日期：2020-11-06 17:56

本公开提供了一种基于多视图双聚类的就医欺诈行为检测方法及系统，获取就诊信息和人口统计学信息，并对获得的数据进行预处理；根据预处理后得到的医保参保个体的医保就医记录，在参保人集合与就医时间和就医地点信息集合构成的第一视图和参保人集合与药物信息集合组成的第二视图上同时进行双聚类，得到跨视图一致的患者集群作为就医欺诈行为群体；利用双聚类算法，同时引入健康医疗知识库，不仅可以挖掘频繁地在相同时间相同地点就医的可疑患者群体，而且还可以将其中因长期有规律就医导致被误判的正常患者过滤，从而更加精确地识别医保欺诈行为。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多视图双聚类的就医欺诈行为检测方法及系统
本公开涉及计算机
，特别涉及一种基于多视图双聚类的就医欺诈行为检测方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
，并不必然构成现有技术。医疗保险制度是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。随着医疗保险事业的蓬勃发展，少数不法人员出于利益考虑，开始了针对医保基金的欺诈行为。本公开专利技术人发现，传统的医保反欺诈工作主要依赖制定规则，首先制定医保欺诈规则，基于规则对参保人的就医行为进行鉴别，并确定欺诈人及其欺诈行为；这种方式高度依赖专家的经验，一般都是在欺诈行为发生之后，才能制定相应的规则，无法快速高效地识别医保欺诈行为。本公开专利技术人还发现，目前存在异常共现就医欺诈行为，该行为具体是指，有一些欺诈者，通过某种方式收集获取多名参保人的医保卡，利用这些医保卡购买药品然后倒卖，骗取医保基金，这些欺诈者为了降低欺诈成本，通常会在一次欺诈行为中使用多张医保卡购买药品。针对上述行为，以往的异常共现就医欺诈行为识别方法，仅仅考虑挖掘频繁地在相同时间相同地点就医的可疑患者群体，而没有考虑部分正常患者因长期有规律就医导致被误判的情形，因此检测结果不够准确。
技术实现思路
为了解决现有技术的不足，本公开提供了一种基于多视图双聚类的就医欺诈行为检测方法及系统，利用双聚类算法，同时引入健康医疗知识库，不仅可以挖掘频繁地在相同时间相同地点就医的可疑患者群体，而且还可以将其中因长期...

【技术保护点】
1.一种基于多视图双聚类的就医欺诈行为检测方法，其特征在于，包括以下步骤：/n获取就诊信息和人口统计学信息，并对获得的数据进行预处理；/n根据预处理后得到的医保参保个体的医保就医记录，构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图；/n在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类，得到跨视图一致的患者集群作为就医欺诈行为群体。/n

【技术特征摘要】
1.一种基于多视图双聚类的就医欺诈行为检测方法，其特征在于，包括以下步骤：
获取就诊信息和人口统计学信息，并对获得的数据进行预处理；
根据预处理后得到的医保参保个体的医保就医记录，构建包含医保就医记录中医保参保个体集合、医保就医记录中就医时间和就医地点信息集合以及医保就医记录中的药物信息集合的异构加权图；
在参保个体集合与就医时间和就医地点信息集合构成的第一视图和参保个体集合与药物信息集合组成的第二视图上同时进行双聚类，得到跨视图一致的患者集群作为就医欺诈行为群体。

2.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法，其特征在于，所述异构加权图包括医保参保个体与药物之间相连的边以及医保参保个体与就医时间和就医地点之间的边，每条边对应有相应的权重。

3.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法，其特征在于，通过第一矩阵表示第一视图，通过第二矩阵表示第二视图，所述第一矩阵和第二矩阵的行数均为医保参保个体集合中包含的元素数目，第一矩阵的列数为就医时间和就医地点信息集合中包含的元素数目，第一矩阵的列数为药物集合中包含的元素数目，第一矩阵和第二矩阵中的元素为对应的权重值。

4.如权利要求1所述的基于多视图双聚类的就医欺诈行为检测方法，其特征在于，双聚类的目标函数，具体为：

其中，Bn表示所有长度为n的二进制向量集合，lω和是提前定义的超参，向量ω用于使不同视图的行聚集结果相同，向量wk表示相应视图中的权重，diag(.)表示以相应向量为对角线元素的对角矩阵，d表示视图数量，n维向量uk和r维向量vk分别代表矩阵Xk经过矩阵分解后得到的左、右向量，k＝1,...,d，ω∈Bn。

5.如权利要求4所述的基...

【专利技术属性】
技术研发人员：郭伟，李瑞璨，李晖，闫中敏，崔立真，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人