异常医保数据排查方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24497674 阅读:30 留言:0更新日期:2020-06-13 03:41
本申请涉及大数据领域,具体涉及一种异常医保数据排查方法、装置、计算机设备和存储介质。所述方法包括:接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有用户标识;对所述医保结算数据进行数据清洗;通过清洗后的所述医保结算数据计算所述用户标识之间的相关度;根据所述相关度从所述用户标识中提取符合要求的用户标识,并得到违规集合,所述违规集合中的所述用户标识的相关度大于预设阈值,所述预设阀值是用于表征与所述用户标识对应的医保结算数据的相关度的参数;删除所述医保结算数据中与所述违规集合对应的违规数据,并将删除后的所述医保结算数据发送给终端。采用本方法能够能够对违规医保数据进行清洗。

Troubleshooting methods, devices, computer equipment and storage media of abnormal medical insurance data

【技术实现步骤摘要】
异常医保数据排查方法、装置、计算机设备和存储介质
本申请涉及数据清洗
,特别是涉及一种异常医保数据排查方法、装置、计算机设备和存储介质。
技术介绍
在获取到参保人员的医保结算数据后,服务器需要对医保结算数据进行内容提取并进行数据审核。在对结算数据进行提取和审核之前,计算机需要将医保结算数据中的异常结算数据进行标识,计算机再将被标识的异常数据从大量的结算数据中排除。可是,当医药贩子提前收集一批参保人的医保卡,利用医保卡批次低价购药时,计算机无法排查出此类异常数据,因而无法顺利实现医保结算数据的正常审核,而且计算机需要耗费大量的运算内存对异常数据进行处理,降低了系统资源的有效利用率。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够对违规异常医保数据进行清洗的异常医保数据排查方法、装置、计算机设备和存储介质。一种异常医保数据排查方法,所述方法包括:接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有用户标识;对所述医保结算数据进行数据清洗;通过清洗后的所述医保结算数据计算所述用户标识之间的相关度;根据所述相关度从所述用户标识中提取符合要求的用户标识,并得到违规集合,所述违规集合中的所述用户标识的相关度大于预设阈值,所述预设阀值是用于表征与所述用户标识对应的医保结算数据的相关度的参数;删除所述医保结算数据中与所述违规集合对应的违规数据,并将删除后的所述医保结算数据发送给终端。在其中一个实施例中,所述对所述医保结算数据进行数据清洗,包括:对所述医保结算数据进行解析抽取,得到结算明细表;确定所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;确定所述结算明细表中与缺失值所在变量最相似的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的医保结算数据。在其中一个实施例中,所述通过清洗后的所述医保结算数据计算所述用户标识之间的相关度,包括:从清洗后的所述医保结算数据中获取与所述用户标识对应的结算时间和结算地址;根据所述用户标识、所述结算时间和所述结算地址确定矩阵布局,并根据所述矩阵布局和所述用户标识的出现次数得到相关矩阵;根据所述相关矩阵计算所述用户标识之间的相关度。在其中一个实施例中,所述删除所述医保结算数据中与所述违规集合对应的违规数据,包括:获取所述违规集合中疑似违规参保人的结算时间;根据所述结算时间建立所述疑似违规参保人的结算时间轴;将所述违规集合的所述疑似违规参保人的结算时间映射到结算时间轴进行比对,得到与所述用户标识对应的违规时间;从所述医保结算数据中删除与所述用户标识和所述违规时间对应的违规数据。在其中一个实施例中,所述将所述违规集合的各疑似违规参保人的结算时间轴进行比对,得到所述用户标识对应的违规时间,包括:获取预设结算时间差和预设频次;将同一所述违规集合的各疑似违规参保人的结算时间轴进行比对,得到各所述疑似违规参保人之间的结算时间差值;统计各所述疑似违规参保人的结算时间差值小于预设结算时间差的相交频次;将所述相交频次大于预设频次的疑似违规参保人判定为违规参保人,并根据所述相交频次获取对应的违规时间。一种异常医保数据排查装置,所述装置包括:数据接收模块,用于接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有用户标识;数据清洗模块,用于对所述医保结算数据进行数据清洗;相关度计算模块,用于通过清洗后的所述医保结算数据计算所述用户标识之间的相关度;违规选取模块,用于根据所述相关度从所述用户标识中提取符合要求的用户标识,并得到违规集合,所述违规集合中的所述用户标识的相关度大于预设阈值,所述预设阀值是用于表征与所述用户标识对应的医保结算数据的相关度的参数;数据删除处理模块,用于删除所述医保结算数据中与所述违规集合对应的违规数据,并将删除后的所述医保结算数据发送给终端。在其中一个实施例中,所述数据清洗模块,包括:数据抽取单元,用于对所述医保结算数据进行解析抽取,得到结算明细表;异常排查单元,用于确定所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;缺失补充单元,用于确定所述结算明细表中与缺失值所在变量最相似的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的医保结算数据。在其中一个实施例中,所述相关度计算模块,包括:结算数据获取单元,用于从清洗后的所述医保结算数据中获取与所述用户标识对应的结算时间和结算地址;相关矩阵建立单元,用于根据所述用户标识、所述结算时间和所述结算地址确定矩阵布局,并根据所述矩阵布局和所述用户标识的出现次数得到相关矩阵;相关度计算单元,用于根据所述相关矩阵计算所述用户标识之间的相关度。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。上述异常医保数据排查方法、装置、计算机设备和存储介质,通过医保结算数据计算用户标识之间的相关度,根据相关度选取与多个用户标识对应的违规集合,删除医保结算数据中与违规集合对应的违规数据,从而在无法识别违规数据的情况下,通过对相关度进行分析,建立违规数据的筛选标准,顺利实现了医保结算数据的排查和删除,保证了医保结算数据的正常审核。附图说明图1为一个实施例中异常医保数据排查方法的应用场景图;图2为一个实施例中异常医保数据排查方法的流程示意图;图3为一个实施例中异常医保数据排查步骤的流程示意图;图4为另一个实施例中异常医保数据排查方法的流程示意图;图5为一个实施例中异常医保数据排查装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的异常医保数据排查方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104接收数据库发送的预设周期内的医保结算数据,医保结算数据携带有用户标识;服务器104对医保结算数据进行数据清洗;服务器104通过清洗后的医保结算数据计算用户标识之间的相关度;服务器104根据相关度从用户标识中提取符合要求的用户标识,并得到违规集合,违规集合中的用户标识的相关度大于预设阈值,预设阀值是用于表征与用户标识对应的医保结算数据的相关度的参数;服务器104删除医保结算数据中与违规集合对应的违规数据,并将删除后的医保结算数据发送给终端102。其中,终端102可以但不限于是各种个人本文档来自技高网...

【技术保护点】
1.一种异常医保数据排查方法,所述方法包括:/n接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有用户标识;/n对所述医保结算数据进行数据清洗;/n通过清洗后的所述医保结算数据计算所述用户标识之间的相关度;/n根据所述相关度从所述用户标识中提取符合要求的用户标识,并得到违规集合,所述违规集合中的所述用户标识的相关度大于预设阈值,所述预设阀值是用于表征与所述用户标识对应的医保结算数据的相关度的参数;/n删除所述医保结算数据中与所述违规集合对应的违规数据,并将删除后的所述医保结算数据发送给终端。/n

【技术特征摘要】
1.一种异常医保数据排查方法,所述方法包括:
接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有用户标识;
对所述医保结算数据进行数据清洗;
通过清洗后的所述医保结算数据计算所述用户标识之间的相关度;
根据所述相关度从所述用户标识中提取符合要求的用户标识,并得到违规集合,所述违规集合中的所述用户标识的相关度大于预设阈值,所述预设阀值是用于表征与所述用户标识对应的医保结算数据的相关度的参数;
删除所述医保结算数据中与所述违规集合对应的违规数据,并将删除后的所述医保结算数据发送给终端。


2.根据权利要求1所述的方法,其特征在于,所述对所述医保结算数据进行数据清洗,包括:
对所述医保结算数据进行解析抽取,得到结算明细表;
确定所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;
确定所述结算明细表中与缺失值所在变量最相似的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的医保结算数据。


3.根据权利要求1所述的方法,其特征在于,所述通过清洗后的所述医保结算数据计算所述用户标识之间的相关度,包括:
从清洗后的所述医保结算数据中获取与所述用户标识对应的结算时间和结算地址;
根据所述用户标识、所述结算时间和所述结算地址确定矩阵布局,并根据所述矩阵布局和所述用户标识的出现次数得到相关矩阵;
根据所述相关矩阵计算所述用户标识之间的相关度。


4.根据权利要求1所述的方法,其特征在于,所述删除所述医保结算数据中与所述违规集合对应的违规数据,包括:
获取所述违规集合中疑似违规参保人的结算时间;
根据所述结算时间建立所述疑似违规参保人的结算时间轴;
将所述违规集合的所述疑似违规参保人的结算时间映射到结算时间轴进行比对,得到与所述用户标识对应的违规时间;
从所述医保结算数据中删除与所述用户标识和所述违规时间对应的违规数据。


5.根据权利要求4所述的方法,其特征在于,所述将所述违规集合的各疑似违规参保人的结算时间轴进行比对,得到所述用户标识对应的违规时间,包括:
获取预设结算时间差和预设频次;
将同一所述违规集合的各疑似违规参保人的结算时间轴进行比对,得到各所述疑似违规参保人之间...

【专利技术属性】
技术研发人员:张旭
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1