一种数据中心容灾系统技术方案

技术编号:38717710 阅读:13 留言:0更新日期:2023-09-08 15:00
本发明专利技术涉及数据处理技术领域,具体涉及一种数据中心容灾系统,包括:数据预处理模块、相似度获取模块、编码模块、存储模块,采集医院信息数据并生成待编码数据序列;读入待编码数据序列并获取匹配到的字符串;根据匹配到的字符串更新搜索缓冲区;根据更新前后的搜索缓冲区中包含的字符种类及频数获取字符频率分布序列;根据更新前后的搜索缓冲区的字符频率分布序列获取更新前后的搜索缓冲区的相似度;根据相似度结果扩展搜索缓冲区长度;根据最终获取搜索缓冲区对待编码数据序列行编码;存储编码后的医院信息数据,实现医院信息数据容灾系统构建。本发明专利技术提高了容灾系统的数据存储率和存储效率。储效率。储效率。

【技术实现步骤摘要】
一种数据中心容灾系统


[0001]本专利技术涉及数据压缩
,具体涉及一种数据中心容灾系统。

技术介绍

[0002]对于IT而言,容灾系统就是为计算机信息系统提供的一个能应付各种灾难的环境,当计算机系统在遭受如水灾、战争等不可抗拒的自然灾害以及人为灾难时,容灾系统可以保证用户数据的安全性。目前的医院已经发展为现代化的综合性医院,为了实现医院管理的科学化、现代化,实现数据全面共享,共同形成全面的医院信息管理系统。由于医院信息系统涉及临床、实验室信息系统、医学影像管理、患者信息等多个重要系统,庞大的信息系统比人会产生大量数据,而且医院作为重点单位,系统中通常存实验等重要数据,若医院信息系统遭到自然灾害或黑客入侵,不免会造成数据损坏甚至系统瘫痪,因此建立一种医院信息容灾系统非常重要。
[0003]由于医院信息系统的数据庞大且复杂,对数据进行备份以构建容灾系统可能会耗费大量的人力和物力,由于对数据进行压缩备份在提高备份效率的同时,既可以减轻计算机系统运行压力也能保证数据完整。编码作为一种基于数据重复性的无损压缩方法,具有较强的压缩比,但是只考虑到当前搜索缓冲区内数据的重复性,若搜索缓冲区的长度长,会降低编码的时间效率;反之搜索缓冲区的长度短时,包含的待编码数据序列中字符串的可能性较低,导致压缩效率降低。

技术实现思路

[0004]本专利技术提供一种数据中心容灾系统,以解决现有的问题。
[0005]本专利技术的一种数据中心容灾系统采用如下技术方案:本专利技术一个实施例提供了一种数据中心容灾系统,该系统包括以下模块:数据预处理模块、用于采集医院信息数据,利用平滑算法处理医院信息数据并将医院信息数据按行展开获取待编码数据序列;相似度获取模块、用于根据预设的搜索缓冲区对待编码数据序列进行匹配操作,得到匹配到的字符串;根据编码算法对匹配到的字符串进行编码获取编码结果;根据匹配到的字符串更新搜索缓冲区;根据更新前后的搜索缓冲区中包含的字符种类及频率获取字符频率分布序列;根据更新前后的搜索缓冲区的字符频率分布序列获取更新前后的搜索缓冲区的相似度;编码模块、用于根据更新前后的搜索缓冲区的相似度调整搜索缓冲区的长度,得到最终的搜索缓冲区;根据最终的搜索缓冲区继续对待编码数据序列进行匹配操作,直到待编码数据序列中所有字符都已完成遍历时停止迭代,将编码过程中所有匹配到的字符串的编码结果构成医院信息数据的压缩数据;存储模块、用于对医院信息数据的压缩数据进行存储,实现医院信息数据容灾系统构建。
[0006]优选的,所述根据匹配到的字符串更新搜索缓冲区,包括的具体方法为:将搜索缓冲区中匹配到的字符串以及搜索缓冲区中在匹配到的字符串位置以前的字符从搜索缓冲区中剔除,并将待编码数据序列中匹配到的字符串和与字符串相邻的后一位字符加入到搜索缓冲区的末尾,完成搜索缓冲区的更新。
[0007]优选的,所述根据更新前后的搜索缓冲区中包含的字符种类及频率获取字符频率分布序列,包括的具体方法为:获取更新前后的搜索缓冲区的字符种类并将字符种类进行整合,分别在更新前后的搜索缓冲区中统计所有种类字符出现频率,构成更新前的搜索缓冲区的字符频率分布序列以及更新后的搜索缓冲区的字符频率分布序列,更新前后的搜索缓冲区的字符频率分布序列中每个位置对应的字符是相同的。
[0008]优选的,所述根据更新前后的搜索缓冲区的字符频率分布序列获取更新前后的搜索缓冲区的相似度,包括的具体公式为:
[0009]其中,表示滑动的第个更新前后搜索缓冲区的相似度,且,其中表示遍历整个待编码数据序列需要的搜索缓冲区个数,表示归一化处理后的第个更新前的搜索缓冲区与待编码数据序列匹配到的字符串的长度,和分别表示更新前和更新后的搜索缓冲区的字符频率分布序列中第个字符对应的频率,表示更新前和更新后的搜索缓冲区中所有的字符种类数,表示以自然数为底的指数函数。
[0010]优选的,所述根据更新前后的搜索缓冲区的相似度调整搜索缓冲区的长度,得到最终的搜索缓冲区,包括的具体方法为:预设相似度阈值,进行更新前后的搜索缓冲区的相似度的判断操作:当更新前后的搜索缓冲区的相似度大于或等于相似度阈值时,将更新后的搜索缓冲区作为最终的搜索缓冲区;当更新前后的搜索缓冲区的相似度小于相似度阈值时,根据预设的扩展长度a,将更新后的搜索缓冲区向前扩展a个字符,得到再次更新后的搜索缓冲区,获取更新前的搜索缓冲区与再次更新后的搜索缓冲区的相似度,重复进行更新前的搜索缓冲区与再次更新后的搜索缓冲区的相似度的判断操作,直到得到最终的搜索缓冲区时停止迭代。
[0011]本专利技术的技术方案的有益效果是:能够根据搜索缓冲区和待编码数据序列的匹配结果更新搜索缓冲区,缩短了搜索缓冲区的长度,能够提高匹配速度;根据更新前后的搜索缓冲区的相似度判断是否调整搜索缓冲区,并前向扩展搜索缓冲区,确保了压缩率;本实施例提高了医院信息数据的压缩效率。
附图说明
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本专利技术一种数据中心容灾系统的结构框图。
具体实施方式
[0014]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种数据中心容灾系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0015]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0016]下面结合附图具体的说明本专利技术所提供的一种数据中心容灾系统的具体方案。
[0017]请参阅图1,其示出了本专利技术一个实施例提供的一种数据中心容灾系统的结构框图,该系统包括以下模块:数据采集模块101.利用医院信息系统采集医院信息数据并分类,获得待编码数据序列。
[0018]需要说明的是,获取医院信息系统中的数据,按照临床信息、实验室信息、患者信息以及医学影像信息等类别将采集到的数据进行分类。由于编码算法基于数据重复性压缩,而未处理的数据可能受到噪声等多方面的影响造成数据的重复性较差,从而可能会影响压缩效果。因此本实施例利用平滑算法对采集到的多个类别的信息数据进行处理,使相邻时间点和空间点的数据更接近,增加了数据重复的可能性。
[0019]需要说明的是,通常利用医院信息系统采集到的医院信息数据,包括了日期、科室、患者数量等多个信息,并利用二维数据表进行存储,为方便后续进行数据压缩,本实施例将数据表看作一个二维矩阵,将矩阵进行转置后按照行展开的方式生成一维数据序列,将生成的一维数据序列视作待编码数据序列。
[0020]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心容灾系统,其特征在于,该系统包括以下模块:数据预处理模块、用于采集医院信息数据,利用平滑算法处理医院信息数据并将医院信息数据按行展开获取待编码数据序列;相似度获取模块、用于根据预设的搜索缓冲区对待编码数据序列进行匹配操作,得到匹配到的字符串;根据编编码算法对匹配到的字符串进行编码获取编码结果;根据匹配到的字符串更新搜索缓冲区;根据更新前后的搜索缓冲区中包含的字符种类及频率获取字符频率分布序列;根据更新前后的搜索缓冲区的字符频率分布序列获取更新前后的搜索缓冲区的相似度;编码模块、用于根据更新前后的搜索缓冲区的相似度调整搜索缓冲区的长度,得到最终的搜索缓冲区;根据最终的搜索缓冲区继续对待编码数据序列进行匹配操作,直到待编码数据序列中所有字符都已完成遍历时停止迭代,将编码过程中所有匹配到的字符串的编码结果构成医院信息数据的压缩数据;存储模块、用于对医院信息数据的压缩数据进行存储,实现医院信息数据容灾系统构建。2.根据权利要求1所述一种数据中心容灾系统,其特征在于,所述根据匹配到的字符串更新搜索缓冲区,包括的具体方法为:将搜索缓冲区中匹配到的字符串以及搜索缓冲区中在匹配到的字符串位置以前的字符从搜索缓冲区中剔除,并将待编码数据序列中匹配到的字符串和与字符串相邻的后一位字符加入到搜索缓冲区的末尾,完成搜索缓冲区的更新。3.根据权利要求1所述一种数据中心容灾系统,其特征在于,所述根据更新前后的搜索缓冲区中包含的字符种类及频率获取字符频率分布序列,包括的具体方法为:获取更新前后的搜索缓冲区的字符种类并将字符种类进行...

【专利技术属性】
技术研发人员:秦丽娟尤沛姚新美孙艺梦刘晓森
申请(专利权)人:山东五棵松电气科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1