医保数据分析方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24332251 阅读:24 留言:0更新日期:2020-05-29 20:13
本申请涉及大数据领域,具体涉及一种医保数据分析方法、装置、计算机设备和存储介质。所述方法包括:接收数据库发送的预设周期内的医保结算数据,医保结算数据携带有参保标识、结算日期和结算地址;根据结算日期对医保结算数据进行分组,得到数据分组;获取运算线程通道,通过运算线程通道对数据分组进行多线程并行处理,得到相遇参保标识,采用运算线程通道对数据分组中与参保标识对应的日期数据进行线程并发分析,筛选出相遇参保标识;根据结算地址对相遇参保标识进行分类,得到分类结果;根据医保结算数据的时间轴对分类结果进行比对,识别出违规参保标识,并将违规参保标识发送给医保终端。采用本方法能够对大批量医保数据快速进行异常排查。

Medical insurance data analysis methods, devices, computer equipment and storage media

【技术实现步骤摘要】
医保数据分析方法、装置、计算机设备和存储介质
本申请涉及数据清洗
,特别是涉及一种医保数据分析方法、装置、计算机设备和存储介质。
技术介绍
在获取到参保人员的医疗结算数据后,服务器需要对医疗结算数据进行内容提取并进行数据审核。在对结算数据进行提取和审核之前,计算机需要将医保结算数据中的异常结算数据进行标识,计算机再将被标识的异常数据从大量的结算数据中排除,可是,医保结算数据对应的参保人数量是以万为单位,计算机需要花费大量的运算时间进行异常排查,运行效率较低,而且当医药贩子利用医保卡批次低价购药时,计算机无法确定与异常医保卡对应的用户标识,因而无法排查出此类异常数据,也无法对此类异常数据进行分类分析。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够对大批量医保数据快速进行异常排查的医保数据分析方法、装置、计算机设备和存储介质。一种医保数据分析方法,所述方法包括:接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识、结算日期和结算地址;根据所述结算日期对所述医保结算数据进行分组,得到数据分组;获取运算线程通道,通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,其中,采用所述运算线程通道对所述数据分组中与所述参保标识对应的日期数据进行线程并发分析,筛选出相遇参保标识;根据所述结算地址对多线程处理的所述相遇参保标识进行分类,得到分类结果;根据所述医保结算数据的时间轴对所述分类结果进行比对,识别出违规参保标识,并将所述违规参保标识发送给医保终端。在其中一个实施例中,所述通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,包括:将所述数据分组分配给所述运算线程通道,生成与所述运算线程通道对应的分组队列;根据所述医保结算数据存储在同一地址设置固定大小的缓冲区数组作为运算线程通道的共享空间,初始化计数信号;在所述运算线程通道中创建录入线程和运算线程,当在所述录入线程向缓冲区写入数据时,所述运算线程通道更新设置的计数信号,并通过所述计数信号确定所述录入线程和所述运算线程之间的同步;采用所述录入线程以数据预取的方式根据分组队列将数据分组存入缓冲区数组,所述运算线程是对写入缓冲区数组的数据分组进行运算处理,得到相遇参保标识。在其中一个实施例中,所述通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,包括:获取所述数据分组中与参保标识对应的日期透视参数,并构建与日期透视参数对应的第一矩阵;根据预设规则获取预设顺序的参保标识的日期透视参数构建第二矩阵,所述第二矩阵的行数和列数不大于所述第一矩阵的行数和列数;多线程计算所述第二矩阵对应的转置矩阵和所述第一矩阵的乘积,得到第三矩阵,第三矩阵用于表示在医保结算数据中预设顺序参保人与所有参保人的相遇次数;获取所述第三矩阵中相遇次数大于预设相遇阈值的不同参保人的相遇参保标识,得到相遇参保标识。在其中一个实施例中,所述根据所述结算日期对所述医保结算数据进行分组,得到数据分组,包括:对所述医保结算数据进行解析抽取,得到结算明细表;排查所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;确定所述结算明细表中与缺失值所在变量最相关的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的所述结算明细表;根据所述结算日期对清洗后的所述结算明细表进行分组,得到与所述结算日期对应的数据分组。在其中一个实施例中,所述根据所述结算日期对所述医保结算数据进行分组,得到数据分组,包括:根据所述参保标识和所述结算地址确定矩阵布局,并根据所述矩阵布局和所述医保结算数据的地址透视参数得到相关系数矩阵;根据相关系数矩阵计算所述参保标识之间的相关系数;将相关系数大于预设阈值的不同参保人进行归类,得到数据分组。在其中一个实施例中,所述根据所述医保结算数据的时间轴对所述分类结果进行比对,识别出违规参保标识,包括:根据所述医保结算数据构建时间轴,将所述时间轴分为多个时间段;在所述时间轴上映射与所述分类结果的所述相遇参保标识对应的结算时刻;对所述时间轴上各个所述时间段内的相遇参保标识进行分析,得到与违规参保人对应的违规参保标识。一种医保数据分析装置,所述装置包括:医保数据接收模块,用于接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识、结算日期和结算地址;数据分组模块,用于根据所述结算日期对所述医保结算数据进行分组,得到数据分组;数据处理模块,用于获取运算线程通道,通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,其中,采用所述运算线程通道对所述数据分组中与所述参保标识对应的日期数据进行线程并发分析,筛选出所述相遇参保标识;数据分类模块,用于根据所述结算地址对多线程处理的所述相遇参保标识进行分类,得到分类结果;违规标识识别模块,用于根据所述医保结算数据的时间轴对所述分类结果进行比对,识别出违规参保标识,并将所述违规参保标识发送给医保终端。在一个实施例中,所述数据处理模块,包括:队列分配单元,用于将所述数据分组分配给所述运算线程通道,生成与所述运算线程通道对应的分组队列;共享空间设置单元,用于根据所述医保结算数据存储在同一地址设置固定大小的缓冲区数组作为运算线程通道的共享空间,初始化计数信号;线程创建单元,用于在所述运算线程通道中创建录入线程和运算线程,当在所述录入线程向缓冲区写入数据时,所述运算线程通道更新设置的计数信号,并通过所述计数信号确定所述录入线程和所述运算线程之间的同步;线程运行单元,用于采用所述录入线程以数据预取的方式根据分组队列将数据分组存入缓冲区数组,所述运算线程是对写入缓冲区数组的数据分组进行运算处理,得到相遇参保标识。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。上述医保数据分析方法、装置、计算机设备和存储介质,通过运算线程通道对医保结算数据进行多线程并行处理,得到相遇参保标识,并根据结算地址对汇总后的相遇参保标识进行分类,得到分类结果,通过时间轴对分类结果确定违规参保标识,不仅多层次地对医保结算数据进行分析,还在硬性计算内容的过程中合理地使用了服务器的闲置资源,实现了快速对医保结算数据的异常分析,从而提升了模型的效率。附图说明图1为一个实施例中医保数据分析方法的应用场景图;图2为一个实施例中医保数据分析方法的流程示意图;图3为一个实施例中医保数据分析步骤的流程示意图;图4为另一个实施例中医保数据分析步骤的流程示意图;...

【技术保护点】
1.一种医保数据分析方法,所述方法包括:/n接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识、结算日期和结算地址;/n根据所述结算日期对所述医保结算数据进行分组,得到数据分组;/n获取运算线程通道,通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,其中,采用所述运算线程通道对所述数据分组中与所述参保标识对应的日期数据进行线程并发分析,筛选出所述相遇参保标识;/n根据所述结算地址对多线程处理的所述相遇参保标识进行分类,得到分类结果;/n根据所述医保结算数据的时间轴对所述分类结果进行比对,识别出违规参保标识,并将所述违规参保标识发送给医保终端。/n

【技术特征摘要】
1.一种医保数据分析方法,所述方法包括:
接收数据库发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识、结算日期和结算地址;
根据所述结算日期对所述医保结算数据进行分组,得到数据分组;
获取运算线程通道,通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,其中,采用所述运算线程通道对所述数据分组中与所述参保标识对应的日期数据进行线程并发分析,筛选出所述相遇参保标识;
根据所述结算地址对多线程处理的所述相遇参保标识进行分类,得到分类结果;
根据所述医保结算数据的时间轴对所述分类结果进行比对,识别出违规参保标识,并将所述违规参保标识发送给医保终端。


2.根据权利要求1所述的方法,其特征在于,所述通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,包括:
将所述数据分组分配给所述运算线程通道,生成与所述运算线程通道对应的分组队列;
根据所述医保结算数据存储在同一地址设置固定大小的缓冲区数组作为运算线程通道的共享空间,初始化计数信号;
在所述运算线程通道中创建录入线程和运算线程,当在所述录入线程向缓冲区写入数据时,所述运算线程通道更新设置的计数信号,并通过所述计数信号确定所述录入线程和所述运算线程之间的同步;
采用所述录入线程以数据预取的方式根据分组队列将数据分组存入缓冲区数组,所述运算线程是对写入缓冲区数组的数据分组进行运算处理,得到相遇参保标识。


3.根据权利要求1所述的方法,其特征在于,所述通过所述运算线程通道对所述数据分组进行多线程并行处理,得到相遇参保标识,包括:
获取所述数据分组中与参保标识对应的日期透视参数,并构建与日期透视参数对应的第一矩阵;
根据预设规则获取预设顺序的参保标识的日期透视参数构建第二矩阵,所述第二矩阵的行数和列数不大于所述第一矩阵的行数和列数;
多线程计算所述第二矩阵对应的转置矩阵和所述第一矩阵的乘积,得到第三矩阵,第三矩阵用于表示在医保结算数据中预设顺序参保人与所有参保人的相遇次数;
获取所述第三矩阵中相遇次数大于预设相遇阈值的不同参保人的相遇参保标识,得到相遇参保标识。


4.根据权利要求1所述的方法,其特征在于,所述根据所述结算日期对所述医保结算数据进行分组,得到数据分组,包括:
对所述医保结算数据进行解析抽取,得到结算明细表;
排查所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;
确定所述结算明细表中与缺失值所在变量最相关的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的所述结算明细表;
根据所述结算日期对清洗后的所述结算明细表进行分组,得到与所述结算日期对应的数据分组。


5.根据权利要求1所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:张旭
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1