【技术实现步骤摘要】
医保数据处理方法、装置、计算机设备和存储介质
本申请涉及数据清洗
,特别是涉及一种医保数据处理方法、装置、计算机设备和存储介质。
技术介绍
通过医疗保险,参保人员可以以低廉的价格购买各种医保药品。出于利益,医药贩子会与参保人合作,提前收集一批参保人的医保卡,利用医保卡批次低价购药,这种行为损害了其他参保人的医保利益,需要及时进行标识,再将被标识的异常数据从大量的医保结算数据中排除。但是,当医保结算数据对应的参保人数量以万为单位时,对应的医保结算数据量成几何增加,有时可以达到数G,超出了计算机系统的运行内存。因而,如何在保证计算机运行的情况下,对大批量医保结算数据顺利进行排查,降低系统崩溃的概率是医保数据处理的难点。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够对大批量医保结算数据顺利进行排查,降低系统崩溃的概率的医保数据处理方法、装置、计算机设备和存储介质。一种医保数据处理方法,所述方法包括:接收医保终端发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识和购 ...
【技术保护点】
1.一种医保数据处理方法,所述方法包括:/n接收医保终端发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识和购药信息;/n根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量;/n根据所述参保标识和所述购药信息生成数据透视表,并根据所述运算数据量按照预设顺序从所述数据透视表中依次提取所述参保标识的透视参数,构建与所述参保标识对应的透视矩阵;/n采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵,所述共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数;/n根据所述相遇次数对所述参保标识进行筛选得到违规集合,所述违规集合的所述参保标识对应的相遇次数 ...
【技术特征摘要】
1.一种医保数据处理方法,所述方法包括:
接收医保终端发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识和购药信息;
根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量;
根据所述参保标识和所述购药信息生成数据透视表,并根据所述运算数据量按照预设顺序从所述数据透视表中依次提取所述参保标识的透视参数,构建与所述参保标识对应的透视矩阵;
采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵,所述共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数;
根据所述相遇次数对所述参保标识进行筛选得到违规集合,所述违规集合的所述参保标识对应的相遇次数大于预设阈值,并将所述违规集合中的参保标识发送给所述医保终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述参保标识和所述购药信息生成数据透视表,包括:
对所述医保结算数据进行解析抽取,得到结算明细表;
排查所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;
确定所述结算明细表中与缺失值所在变量最相关的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的医保结算数据;
采用预设统计规则对清洗后的所述医保结算数据进行统计,得到数据透视表。
3.根据权利要求1所述的方法,其特征在于,所述根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量,包括:
实时获取运算内存,并根据所述运算内存获取与矩阵计算相关的矩阵运算速度;
获取与所述数据内存对应的运算时间;
根据所述矩阵运算速度和所述运算时间实时确定运算数据量。
4.根据权利要求1所述的方法,其特征在于,所述采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵,包括:
从所述数据透视表中提取与所述参保标识对应的透视参数,并根据所述透视参数构建参考矩阵;
计算所述透视矩阵对应的转置矩阵;
根据所述转置矩阵和所述参考矩阵的乘积得到共现矩阵。
5.根据权利要求1所述的方法,其特征在于,所述根据所述相遇次数对所述参保标识进行筛选得到违规集合之后,还包括:
从所述数据透视表中删除所述违规集合中所述参保标识对应的透视参数;
根据运算数据量按照预设顺序从删除后的数据透视表提取所述...
【专利技术属性】
技术研发人员:张旭,
申请(专利权)人:平安医疗健康管理股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。