一种用于医疗保险主数据存储的数据安全管理系统技术方案

技术编号:37724282 阅读:8 留言:0更新日期:2023-06-02 00:26
本发明专利技术涉及数据处理技术领域,提出了一种用于医疗保险主数据存储的数据安全管理系统,包括:在医疗保险数据库中采集医疗保险主数据;在三维数据空间中对数据点进行聚类得到若干簇类并得到大簇,根据大簇内数据点的局部分布获取每个数据点的第一密集程度,获取每个数据点的第一优化因子,优化得到每个数据点的第二密集程度;根据每个数据点对应参保人员的医疗服务支付信息的历史时序数据获取第二优化因子,根据第二优化因子获取第三密集程度,结合数据点在簇类中的分布获取数据点的备份重要程度;根据备份重要程度对医疗保险主数据进行冗余备份,完成存储的安全管理。本发明专利技术旨在解决数据备份重要程度获取过程中数据点异常判断不准确的问题。判断不准确的问题。判断不准确的问题。

【技术实现步骤摘要】
一种用于医疗保险主数据存储的数据安全管理系统


[0001]本专利技术涉及数据处理
,具体涉及一种用于医疗保险主数据存储的数据安全管理系统。

技术介绍

[0002]医疗保险主数据包括参保人员信息、医疗机构信息、药品信息及疾病信息等,对于医疗保险公司,需要通过这些信息建立保险业务流程,管理参保人员、管控风险及制定保险产品等工作;对于这些医疗保险主数据,需要根据其中的医疗服务支付信息进行医疗保险参保人员的医疗保险异常使用的监测,从而调查和监测医保欺诈行为;因为对于医疗保险欺诈行为的识别与检测需要根据参保人员的多个历史医疗保险主数据进行分析,所以在对医疗保险主数据进行存储的过程中需要将存在异常的数据点进行冗余备份以保证数据安全。
[0003]参保人员的医疗服务支付信息中,包括诊断费用、治疗费用和药品费用,对于医疗保险公司所服务的全部参保人员的三维数据点可以形成一个数据空间,在这个数据空间中可以通过数据点的离群性进行备份重要程度的获取;传统方法是通过K

means聚类获取初步的簇类划分,根据CBLOF的思路确定大簇,根据数据点与簇类中心点的距离确定数据点的离群程度,之后通过离群程度对数据点进行筛选,对筛选出的数据点进行冗余备份;然而在通过每个参保人员的诊断费用、治疗费用与药品费用的总费用数额进行分析的过程中,因为参保人员的费用是由历史费用的总额获取的,当参保人员的总费用数额与其他参保人员相同时,在现有的数据点异常程度的获取过程中无法将费用生成过程中,存在的与同类数据点相比异常的费用特征进行判断,即在数据点的备份重要程度的判断中缺少对于数据点的历史数据分析。

技术实现思路

[0004]本专利技术提供一种用于医疗保险主数据存储的数据安全管理系统,以解决现有的数据备份重要程度获取过程中数据点异常判断不准确的问题,所采用的技术方案具体如下:本专利技术一个实施例提供了一种用于医疗保险主数据存储的数据安全管理系统,该系统包括:医疗保险主数据采集模块,采集每个参保人员的医疗保险主数据,并根据医疗保险主数据中每个参保人员的诊断费用、治疗费用以及药品费用构建三维数据空间并转换为数据点,每个参保人员的医疗保险主数据分别对应一个数据点;医疗保险主数据处理模块:在三维数据空间中对数据点进行聚类得到若干簇类,根据各簇类包含数据点数量获取大簇,根据大簇内数据点的局部分布获取每个数据点的第一密集程度,根据数据点的最近邻及反向最近邻获取每个数据点的第一优化因子,通过第一优化因子对第一密集程度进行优化得到每个数据点的第二密集程度;根据每个数据点对应参保人员的医疗服务支付信息的历史时序数据,获取每个数
据点的第二优化因子,根据第二优化因子获取每个数据点的第三密集程度,获取每个数据点与簇类中心点的欧式距离,将不是大簇的簇类中数据点到簇类中心点的欧式距离记为每个数据点的离群距离,将大簇中每个数据点到簇类中心点的欧式距离与第三密集程度的乘积,记为每个数据点的离群距离,将每个数据点的离群距离的归一化结果记为每个数据点的备份重要程度;医疗保险主数据存储模块,根据备份重要程度对医疗保险主数据进行冗余备份,完成存储的安全管理。
[0005]可选的,所述根据各簇类包含数据点数量获取大簇,包括的具体方法为:获取每个簇类包含数据点的数量,将每个簇类根据包含数据点数量从大到小依次进行累加,当数据点数量累加和与数据点总数量的比值大于预设第一阈值时,停止簇类的数据点数量累加,将参与累加计算的簇类记为大簇。
[0006]可选的,所述根据大簇内数据点的局部分布获取每个数据点的第一密集程度,包括的具体方法为:其中,表示第个大簇中第个数据点的第一密集程度,表示近邻的值,表示第个大簇中第个数据点,表示第个大簇中第个数据点的第个近邻数据点,表示第个大簇中第个数据点与第个大簇中第个数据点的第个近邻数据点的欧式距离,将记为第个大簇中第个数据点的平均近邻距离,表示归一化处理,归一化对象为第个大簇中所有数据点的平均近邻距离。
[0007]可选的,所述根据数据点的最近邻及反向最近邻获取每个数据点的第一优化因子,包括的具体方法为:将第个大簇中第个数据点的近邻数据点的集合记为,第个大簇中第个数据点的第个近邻数据点的近邻数据点的集合记为,若,则为的反向最近邻数据点,第个大簇中第个数据点的第一优化因子的计算方法为:其中,表示近邻的值,表示第个大簇中第个数据点,表示第个大簇中第个数据点的第个近邻数据点,表示不是的反向最近邻数据点的次数,表示从1到的整数进行遍历。
[0008]可选的,所述通过第一优化因子对第一密集程度进行优化得到每个数据点的第二密集程度,包括的具体方法为:
其中,第个大簇中第个数据点的第二密集程度,表示第个大簇中第个数据点的第一优化因子,表示近邻的值,表示第个大簇中第个数据点,表示第个大簇中第个数据点的第个近邻数据点,表示第个大簇中第个数据点与第个大簇中第个数据点的第个近邻数据点的欧式距离,将记为第个大簇中第个数据点的平均优化距离,表示归一化处理,归一化对象为第个大簇中所有数据点的平均优化距离。
[0009]可选的,所述获取每个数据点的第二优化因子,包括的具体方法为:获取每个数据点对应参保人员的医疗服务支付信息的历史时序数据,第个大簇中第个数据点的第二优化因子的计算方法为:其中,表示近邻的值,表示第个大簇中第个数据点,表示第个大簇中第个数据点的第个近邻数据点,表示第个大簇中第个数据点与第个大簇中第个数据点的第个近邻数据点在各自对应的医疗服务支付信息的历史时序数据之间的DTW距离,将记为第个大簇中第个数据点的平均匹配距离,表示归一化处理,归一化对象为第个大簇中所有数据点的平均匹配距离。
[0010]可选的,所述根据第二优化因子获取每个数据点的第三密集程度,包括的具体方法为:获取第个大簇内第个数据点初始的近邻数据点的集合;获取初始的下第个大簇中第个数据点的第个近邻数据点,根据此时的计算的第二优化因子,将第二优化因子与相乘,表示第个大簇中第个数据点与第个大簇中第个数据点的第个近邻数据点的欧式距离,得到的结果记为与的修正距离,表示为;再次获取的近邻数据点集合,此时与之间的距离用修正距离表示,判断修正距离下是否仍为的近邻数据点,得到新的;重复步骤b)与步骤c),对初始的中每个近邻数据点的距离都进行修正,得到新的,并在新的中继续对每个近邻数据点的距离进行修正,直到
不再发生变化,得到最终的近邻数据点集合,记为;基于获取此时的第一优化因子,记为修正第一优化因子,基于及修正第一优化因子进行第二密集程度的计算,得到的结果记为第个大簇内第个数据点的第三密集程度;获取每个大簇中每个数据点的第三密集程度。
[0011]本专利技术的有益效果是:本专利技术通过参保人员医疗服务费用的组成特征对数据点之间的距离进行优化,相较于现有计算过程中的距离衡量,可以在数据点的距离衡量过程中考虑到数据点的历史时序特征,根据数据点之间的特征的差异性对数据点之间的距离进行优化,从而保障了医疗保险主数据存储过程中的数据安全;基于数据点对应历史时序数据之间的DTW距离对近邻数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于医疗保险主数据存储的数据安全管理系统,其特征在于,该系统包括:医疗保险主数据采集模块,采集每个参保人员的医疗保险主数据,并根据医疗保险主数据中每个参保人员的诊断费用、治疗费用以及药品费用构建三维数据空间并转换为数据点,每个参保人员的医疗保险主数据分别对应一个数据点;医疗保险主数据处理模块:在三维数据空间中对数据点进行聚类得到若干簇类,根据各簇类包含数据点数量获取大簇,根据大簇内数据点的局部分布获取每个数据点的第一密集程度,根据数据点的最近邻及反向最近邻获取每个数据点的第一优化因子,通过第一优化因子对第一密集程度进行优化得到每个数据点的第二密集程度;根据每个数据点对应参保人员的医疗服务支付信息的历史时序数据,获取每个数据点的第二优化因子,根据第二优化因子获取每个数据点的第三密集程度,获取每个数据点与簇类中心点的欧式距离,将不是大簇的簇类中数据点到簇类中心点的欧式距离记为每个数据点的离群距离,将大簇中每个数据点到簇类中心点的欧式距离与第三密集程度的乘积,记为每个数据点的离群距离,将每个数据点的离群距离的归一化结果记为每个数据点的备份重要程度;医疗保险主数据存储模块,根据备份重要程度对医疗保险主数据进行冗余备份,完成存储的安全管理。2.根据权利要求1所述的一种用于医疗保险主数据存储的数据安全管理系统,其特征在于,所述根据各簇类包含数据点数量获取大簇,包括的具体方法为:获取每个簇类包含数据点的数量,将每个簇类根据包含数据点数量从大到小依次进行累加,当数据点数量累加和与数据点总数量的比值大于预设第一阈值时,停止簇类的数据点数量累加,将参与累加计算的簇类记为大簇。3.根据权利要求1所述的一种用于医疗保险主数据存储的数据安全管理系统,其特征在于,所述根据大簇内数据点的局部分布获取每个数据点的第一密集程度,包括的具体方法为:其中,表示第个大簇中第个数据点的第一密集程度,表示近邻的值,表示第个大簇中第个数据点,表示第个大簇中第个数据点的第个近邻数据点,表示第个大簇中第个数据点与第个大簇中第个数据点的第个近邻数据点的欧式距离,将记为第个大簇中第个数据点的平均近邻距离,表示归一化处理,归一化对象为第个大簇中所有数据点的平均近邻距离。4.根据权利要求1所述的一种用于医疗保险主数据存储的数据安全管理系统,其特征在于,所述根据数据点的最近邻及反向最近邻获取每个数据点的第一优化因子,包括的具体方法为:将第个大簇中第个数据点的近邻数据点的集合记为,第个大簇中第个数
据点的第个近邻数据点的近邻数据点的集合记为,若,则为的反向最近邻数据点,第...

【专利技术属性】
技术研发人员:刘利锋
申请(专利权)人:北京环球医疗救援有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1