【技术实现步骤摘要】
一种用于沉浸式企业办公系统的数据存储方法
[0001]本专利技术涉及数据处理
,具体涉及一种用于沉浸式企业办公系统的数据存储方法
。
技术介绍
[0002]沉浸式企业办公系统作为一种新兴的技术和应用领域,正在逐渐受到企业的关注和采用
。
该办公系统的使用过程中也会产生大量数据需要进行管理与存储,直接对数据进行传输和存储会占用大量的存储空间和传输带宽,故需要一种用于沉浸式企业办公系统的数据优化存储方法
。
[0003]现有技术通过
rANS
编码进行数据压缩,
rANS
编码是一种无损压缩算法,压缩率高而且实现简单
。
沉浸式企业办公数据中存在较多的重复数据,有着较明显的统计特征,使用
rANS
压缩可以达到很好的压缩率
。rANS
压缩算法通过字符频率计算分布累计表,常规算法通过四舍五入将根据频率获取的分布累计表长度的小数取整
。
[0004]现有的问题:
rANS
压缩算法通过四舍五入直接进行分布累计表长度分配没有考虑字符频率对应不同长度的编码优化程度,而沉浸式企业办公系统中大量重复的数据会导致各字符频率对应的分布累计表长度变化对最终编码长度有着较大的影响,仅通过四舍五入进行取整很难达到较高的压缩率
。
技术实现思路
[0005]本专利技术提供一种用于沉浸式企业办公系统的数据存储方法,以解决现有的问题
。
[0006]本 ...
【技术保护点】
【技术特征摘要】
1.
一种用于沉浸式企业办公系统的数据存储方法,其特征在于,该方法包括以下步骤:根据沉浸式企业办公系统中采集的所有数据对应在
ASCII
表中的字符,构成原数据;将原数据中不同字符的数量,记为原数据中的字符种类数量;将原数据中每个相同字符的数量除以原数据中的字符数量,记为每类字符在原数据中的出现频率;将二的原数据中的字符种类数量的次方,记为原数据的分布累计表的长度;根据原数据的分布累计表的长度
、
每类字符在原数据中的出现频率,得到原数据中每类字符的初始长度和分布累计表的未分配长度;根据原数据中每类字符的初始长度和分布累计表的长度,得到原数据中每类字符的编码长度;根据原数据中每类字符的编码长度和每类字符的初始长度以及分布累计表的长度,得到原数据中每类字符的编码长度缩减量;根据原数据中的字符种类数量和分布累计表的长度,得到原数据中字符编码长度的平均缩减量;根据原数据中字符编码长度的平均缩减量
、
原数据中每类字符的编码长度缩减量,得到原数据中每类字符的编码长度缩减因子;根据原数据中的字符种类数量
、
每类字符在原数据中的出现频率
、
每类字符的编码长度缩减因子,得到原数据中每类字符的分配优先级;根据原数据中每类字符的分配优先级
、
每类字符的初始长度
、
分布累计表的未分配长度,得到原始数据的新分布累计表;根据原始数据的新分布累计表,使用
rANS
算法对原数据进行编码压缩,得到压缩数据,并将压缩数据存储至数据库中
。2.
根据权利要求1所述一种用于沉浸式企业办公系统的数据存储方法,其特征在于,所述根据原数据的分布累计表的长度
、
每类字符在原数据中的出现频率,得到原数据中每类字符的初始长度和分布累计表的未分配长度,包括的具体步骤如下:将每类字符在原数据中的出现频率与原数据的分布累计表的长度的乘积的向下取整,记为原数据中每类字符的初始长度;计算原数据中所有类字符的初始长度之和,将原数据的分布累计表的长度减去所述初始长度之和,记为分布累计表的未分配长度
。3.
根据权利要求1所述一种用于沉浸式企业办公系统的数据存储方法,其特征在于,所述根据原数据中每类字符的初始长度和分布累计表的长度,得到原数据中每类字符的编码长度对应的具体计算公式为:其中为原数据中第
i
类字符的编码长度,为原数据中第
i
类字符的初始长度,为原数据的分布累计表的长度,
n
为原数据中的字符种类数量,为以2为底的负对数
。4.
根据权利要求1所述一种用于沉浸式企业办公系统的数据存储方法,其特征在于,所述根据原数据中每类字符的编码长度和每类字符的初始长度以及分布累计表的长度,得到原数据中每类字符的编码长度缩减量,包括的具体步骤如下:根据原数据中每类字符的初始长度加一
、
原数据的分布累计表的长度,得到原数据中
每类字符的更新编码长度;根据原数据中每类字符的更新编码长度与每类字符的编码长度,得到原数据中每类字符的编码长度缩减量
。5.
根据权利要求4所述一种用于沉浸式企业办公系统的...
【专利技术属性】
技术研发人员:王立蒙,刘怀杰,
申请(专利权)人:北斗七星信息科技山东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。