数据压缩方法及装置、存储介质制造方法及图纸

技术编号:32265521 阅读:21 留言:0更新日期:2022-02-12 19:27
本申请公开了一种数据压缩方法及装置、存储介质。该方法包括:根据训练数据清单,将第一图像文件的一个字节的十六进制数据保存为第一索引号集和第二索引号集;将所述第二索引号集中的任一第二索引号与所述第二索引号集中的最小索引号之差对应的值替换所述第二索引号;保存所述第一索引号集和替换后的所述第二索引号集。还公开了相应的装置和存储介质。采用本申请公开的方案,使用二进制压缩方法来提供高端的压缩比,既可以保证压缩后的原始医学图像的精确质量,又提供非常低的压缩比,可以将医学图像文件压缩到原始文件大小的6%左右,而在解压后不损失任何视觉质量。而在解压后不损失任何视觉质量。而在解压后不损失任何视觉质量。

【技术实现步骤摘要】
数据压缩方法及装置、存储介质


[0001]本申请涉及数据处理
,尤其涉及一种数据压缩方法及装置、存储介质。

技术介绍

[0002]医学图像文件(通常是医学数字影像和通讯(digital imaging and communications in medicine,DICOM)和神经成像信息学技术倡议(neuroimaging informatics technology initiative,NIFTI))构建为原始图像文件(RAW),原始图像文件通常使用数学(完全)无损压缩方法(totally lossless compression,TLC)压缩。
[0003]大多数TLC方法提供不超过压缩比约25%的最大性能结果。例如,JPEGLS和JPEG2K(JPEG2000)提供平均30%到25%的压缩比。
[0004]尽管这些技术,以及消息完整性检查(message integrity check,MIC)完全无损压缩技术,在解压缩后获得原始医学图像文件的精确位对位等价图像文件。对于医疗保健工作人员,如医生,二进制数据通常是无用的。因为他们最终要求的结果是相同的医学图像,在视觉上是与原始医学图像等价的,而不是原始医学图像中的二进制数据。
[0005]目前的医学图像文件压缩方法,在解压缩后为了获得位对位数据,牺牲了巨大的压缩比余量,使得压缩软件无法通过压缩来节省更有利的磁盘空间。
[0006]此外,由于当前的压缩方法需要大量的计算来压缩二进制数据,因此在压缩过程中需要消耗大量的计算资源,如中央处理单元(central processing unit,CPU)和随机存取存储器(random access memory,RAM)。这使得压缩速度更低,并且在医学图像数据中心产生更高的能耗。

技术实现思路

[0007]本申请提供一种数据压缩方法及装置、存储介质,以不损失任何视觉质量的情况下,提供较低的压缩比。
[0008]第一方面,提供了一种数据压缩方法,所述方法包括:
[0009]根据训练数据清单,将第一图像文件的一个字节的十六进制数据保存为第一索引号集和第二索引号集;
[0010]将所述第二索引号集中的任一第二索引号与所述第二索引号集中的最小索引号之差对应的值替换所述第二索引号;
[0011]保存所述第一索引号集和替换后的所述第二索引号集。
[0012]可选地,所述第一索引号集中的第一索引号为至少两位索引号,所述第二索引号集中的第二索引号为一位索引号。
[0013]可选地,所述方法还包括:
[0014]将第二图像文件的一个字节的二进制数据保存为两个十六进制文件;
[0015]获取所述两个十六进制文件中每个十六进制文件中的十六进制值的类型;
[0016]获取每个类型的十六进制值在所述两个十六进制文件中出现的概率;
[0017]根据所述概率,给所述两个十六进制文件中的每个十六进制值分配对应的索引号;
[0018]将所述第二图像文件保存为第三索引号集和第四索引号集。
[0019]可选地,所述方法还包括:
[0020]获取所述第二图像文件的二进制数据;
[0021]提取所述第二图像文件的报头;
[0022]所述将第二图像文件的一个字节的二进制数据保存为两个十六进制文件,包括:
[0023]将所述第二图像文件除所述报头之外的报文本体部分的二进制数据保存为所述两个十六进制文件。
[0024]可选地,所述方法还包括:
[0025]对所述训练数据清单中的多个所述第二图像文件进行训练,获得所有1字节十六进制值的排序概率。
[0026]第二方面,提供了一种数据压缩装置,所述装置包括:
[0027]第一保存单元,用于根据训练数据清单,将第一图像文件的一个字节的十六进制数据保存为第一索引号集和第二索引号集;
[0028]替换单元,用于将所述第二索引号集中的任一第二索引号与所述第二索引号集中的最小索引号之差对应的值替换所述第二索引号;
[0029]第二保存单元,用于保存所述第一索引号集和替换后的所述第二索引号集。
[0030]可选地,所述第一索引号集中的第一索引号为至少两位索引号。所述第二索引号集中的第二索引号为一位索引号。
[0031]可选地,所述装置还包括:
[0032]第三保存单元,用于将第二图像文件的一个字节的二进制数据保存为两个十六进制文件;
[0033]第一获取单元,用于获取所述两个十六进制文件中每个十六进制文件中的十六进制值的类型;
[0034]第二获取单元,用于获取每个类型的十六进制值在所述两个十六进制文件中出现的概率;
[0035]分配单元,用于根据所述概率,给所述两个十六进制文件中的每个十六进制值分配对应的索引号;
[0036]第四保存单元,用于将所述第二图像文件保存为第三索引号集和第四索引号集。
[0037]可选地,所述装置还包括:
[0038]第三获取单元,用于获取所述第二图像文件的二进制数据;
[0039]提取单元,用于提取所述第二图像文件的报头;
[0040]所述第三保存单元,用于将所述第二图像文件除所述报头之外的报文本体部分的二进制数据保存为所述两个十六进制文件。
[0041]可选地,所述装置还包括:
[0042]训练单元,用于对所述训练数据清单中的多个所述第二图像文件进行训练,获得所有1字节十六进制值的排序概率。
[0043]第三方面,提供了一种数据压缩装置,包括存储器、处理器及存储在存储器上并可
在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任一种实现所述的方法。
[0044]第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第一方面的任一种实现所述的方法。
[0045]采用本申请的数据压缩方案,具有如下有益效果:
[0046]使用二进制压缩方法来提供高端的压缩比,既可以保证压缩后的原始医学图像的精确质量,又提供非常低的压缩比,可以将医学图像文件压缩到原始文件大小的6%左右,而在解压后不损失任何视觉质量。
附图说明
[0047]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]图1为本申请实施例提供的一种数据压缩方法的流程示意图;
[0049]图2为本申请实施例提供的另一种数据压缩方法的流程示意图;
[0050]图3为本申请实施例示例的一种数据压缩训练的示意图;
[0051]图4为本申请实施例示例的一种数据压缩的示意图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据压缩方法,其特征在于,所述方法包括:根据训练数据清单,将第一图像文件的一个字节的十六进制数据保存为第一索引号集和第二索引号集;将所述第二索引号集中的任一第二索引号与所述第二索引号集中的最小索引号之差对应的值替换所述第二索引号;保存所述第一索引号集和替换后的所述第二索引号集。2.根据权利要求1所述的方法,其特征在于,所述第一索引号集中的第一索引号为至少两位索引号,所述第二索引号集中的第二索引号为一位索引号。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:将第二图像文件的一个字节的二进制数据保存为两个十六进制文件;获取所述两个十六进制文件中每个十六进制文件中的十六进制值的类型;获取每个类型的十六进制值在所述两个十六进制文件中出现的概率;根据所述概率,给所述两个十六进制文件中的每个十六进制值分配对应的索引号;将所述第二图像文件保存为第三索引号集和第四索引号集。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取所述第二图像文件的二进制数据;提取所述第二图像文件的报头;所述将第二图像文件的一个字节的二进制数据保存为两个十六进制文件,包括:将所述第二图像文件除所述报头之外的报文本体部分的二进制数据保存为所述两个十六进制文件。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:对所述训练数据清单中的多个所述第二图像文件进行训练,获得所有1字节十六进制值的排序概率。6.一种数据压缩装置,其特征...

【专利技术属性】
技术研发人员:白智德白志得哈米德殷燕黄坤
申请(专利权)人:深圳智慧林网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1