【技术实现步骤摘要】
医疗档案数据中异常数据的检测方法、装置和电子设备
[0001]本专利技术涉及计算机
,具体而言,涉及一种医疗档案数据中异常数据的检测方法、装置和电子设备。
技术介绍
[0002]目前,医疗保障制度是一个国家、一个地区按照保险原则为该地区的人民解决就诊、医疗等问题而筹集、分配医疗保障基金问题的制度。由于医疗保障制度所涉及的金额、人群以及其覆盖面都是相当巨大的,这一情况也就使得个人或组织伪造病例以及和医院勾结骗取医疗保障基金的行为层出不穷,造成医疗保障基金的大量流失。为了对医疗档案数据中的异常数据进行检测,采用的检测方式包括:最原始的人工审查、现场抽查以及利用基础的统计分析方法对明显不合理的情况进行范围性审查。上述进行医疗档案数据异常检测的方式的准确率较低。
技术实现思路
[0003]为解决上述问题,本专利技术实施例的目的在于提供一种医疗档案数据中异常数据的检测方法、装置和电子设备。
[0004]第一方面,本专利技术实施例提供了一种医疗档案数据中异常数据的检测方法,包括:
[0005]获取多 ...
【技术保护点】
【技术特征摘要】
1.一种医疗档案数据中异常数据的检测方法,其特征在于,包括:获取多位患者各自的医疗档案数据;所述多位患者中的每位患者的医疗档案数据均包括:患者标识、结算数据和就诊数据;采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理,得到多组所述结算数据对应的核验结果数据,以及确定所述核验结果数据中核验异常数据对应的第一患者标识数据;将多组所述就诊数据分别与预设医疗知识库中的库数据进行比较处理,得到多组所述就诊数据对应的比较结果数据,以及确定所述比较结果数据中比对异常数据对应的第二患者标识数据;当所述第一患者标识数据与所述第二患者标识数据具有相同的患者标识时,则确定所述医疗档案数据中存在异常数据。2.根据权利要求1所述的方法,其特征在于,所述采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理,包括:基于预先训练的随机森林模型对每组所述结算数据进行分类处理,得到该组所述结算数据对应的标签;其中,所述标签用于表征结算数据是否为真实数据。3.根据权利要求1或2所述的方法,其特征在于,所述采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理,包括:采用主成分分析法对多组所述结算数据进行数据降维处理得到多组降维数据;采用基于密度的聚类算法对多组所述降维数据进行聚类处理得到离群数据和聚类数据。4.根据权利要求3所述的方法,其特征在于,在所述采用基于密度的聚类算法对多组所述降维数据进行聚类处理的步骤之后,还包括:分别抽取所述离群数据中部分离群数据和所述聚类数据中部分聚类数据,并利用抽取到的所述部分离群数据和所述部分聚类数据形成迭代数据;采用基于密度的聚类算法对所述迭代数据进行聚类处理得到迭代离群数据和迭代聚类数据。5.根据权利要求3所述的方法,其特征在于,所述采用基于数据驱动的判断方式对多组所述结算数据进行异常核验处理,包括:统计多组所述结算数据中各组所述结算数据的总体资源信息数据;计算各组所述结算数据中每个维度的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。