【技术实现步骤摘要】
一种数据的存储方法及系统
[0001]本专利技术涉及数据处理
,具体涉及一种数据的存储方法及系统。
技术介绍
[0002]在医疗保险数据中对患者的医疗保险费用进行存储时不同患者对应的相同医疗结算事件的费用数据存在着大量冗余,所以需要在数据存储时对数据进行压缩,因为不同患者对应的相同医疗结算事件的费用数据为时序数据,对时序数据进行压缩通常使用旋转门压缩算法。
[0003]在现有的旋转门算法对数据进行压缩时,是将一段时序数据通过容差与斜率的判断划分为一段,再将一段数据进行直线拟合,这样就将一段数据存储为一条直线从而达到数据压缩的效果,但是由于医疗保险数据的特殊性,其在压缩之后可能还会被提取出去进行医疗欺诈检测,其通常是通过分析数据中的离群数据信息进行欺诈检测,而旋转门压缩算法在容差设定后进行斜率阈值判断时不够灵活,往往会将范围内的数据点全部进行数据拟合压缩,导致保险费用数据中的离群数据丢失,使得在后续进行欺诈行为检测时可能存在数据不可用的情况。
技术实现思路
[0004]为了解决现有技术中旋转门压缩算法在容差设定后进行斜率阈值判断时往往不够灵活的问题,本专利技术提供一种数据的存储方法及系统,获取每个患者的医疗保险数据构建时序序列,得到待压缩序列;获取待压缩数据序列中每个数据点对应的SBN路径;获取每个数据点的趋势影响因子;获取每个数据点的平均链接距离;获取每个数据点的趋势离群因子,获取每个医疗结算次数下对应数据点的斜率校正因子;获取每个医疗结算次数下对应数据点的压缩斜率,根据每个数据点的压缩 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种数据的存储方法,其特征在于,包括:获取每个患者的医疗保险数据,并根据每个患者的医疗结算次数构建时序序列,得到每个患者的待压缩序列;将患者每次医疗结算时的医疗保险数据作为待压缩序列中的数据点;获取每个患者的待压缩数据序列中每个数据点对应的SBN路径;根据每个数据点对应的SBN路径中包含数据点的个数获取每个数据点的趋势影响因子;根据每个数据点的趋势影响因子和SBN路径获取每个数据点的平均链接距离;根据每个数据点的平均链接距离获取每个数据点的趋势离群因子,根据所有患者的待压缩序列中相同医疗结算次数下对应数据点的趋势离群因子,获取每个医疗结算次数下对应数据点的斜率校正因子;根据每个医疗结算次数下对应数据点的斜率校正因子获取每个医疗结算次数下对应数据点的压缩斜率,根据每个数据点的压缩斜率对所有患者的待压缩序列进行旋转门压缩,并将压缩后的数据进行存储。2.根据权利要求1所述的一种数据的存储方法,其特征在于,对所有患者的待压缩序列进行旋转门压缩的方法为:获取所有患者的待压缩序列中相同医疗结算次数下的数据点最大值与数据点最小值;将最大值对应数据点的压缩斜率作为旋转门算法的上门斜率,将最小值对应数据点的压缩斜率作为旋转门算法的下门斜率;判断当前医疗结算次数下数据点对应的上门斜率是否大于等于下门斜率;若当前医疗结算次数下数据点对应的上门斜率大于等于下门斜率,将当前医疗结算次数下所有患者对应的数据点进行存储,并对当前医疗结算次数之前的所有数据点进行旋转门压缩;若当前医疗结算次数下数据点对应的上门斜率小于下门斜率,获取下一个医疗结算次数下数据点对应的上门斜率和下门斜率,依次迭代,直至下一个医疗结算次数下数据点对应的上门斜率大于等于下门斜率。3.根据权利要求1所述的一种数据的存储方法,其特征在于,获取每个患者的待压缩数据序列中每个数据点对应的SBN路径的方法为:以待压缩数据序列中的每个数据点作为初始数据点,寻找与初始数据点距离最短的下一个数据点作为第一数据点,获取与第一数据点距离最短的下一个数据点作为第二数据点,依次进行遍历,直至下一个数据点不在初始数据点的设定邻域范围内,得到每个目标像素点对应的所有数据节点;从每个初始数据点开始依次连接对应的所有数据节点,获取两两数据节点之间的路径作为节点路径,根据所有节点路径得到每个目标像素点对应的SBN路径。4.根据权利要求3所述的一种数据的存储方法,其特征在于,获取每个数据点的趋势影响因子的方法为:其中,α
i
表示第i个数据点的趋势影响因子,D为连续趋势计数器,从初始数据点开始,当两两数据节点之间的节点路径与前一个节点路径的变化趋势相同时,D=D+1,则D
r
表示第r
个节点路径的连续趋势计数值,N
k
表示距离初始数据点设定邻域范围为k内数据点的个数且N
k
>1,N
k
‑
技术研发人员:李振峰,
申请(专利权)人:陕西长瑞安驰信息技术集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。