【技术实现步骤摘要】
基于神经网络的数字档案馆图像压缩、存储、恢复方法
[0001]本专利技术属于图像处理领域,具体涉及一种基于神经网络的数字档案馆图像压缩、存储、恢复方法。
技术介绍
[0002]随着多媒体数据库特别是图像库的广泛使用,图像检索技术对现代数字档案馆建设具有十分重要的意义。
[0003]在数字档案馆中,一个典型场景下的图像检索流程涉及到3项具体的技术及其实现:图像的压缩、图像在数据库中的存储、压缩后图像数据的恢复。图像采用何种压缩方法决定了图像在数据库中的存储及相似度计算方法的选型。业界主流的图像压缩方法是将图像以jpg格式保存在文件中,jpg既是一种图像文件格式,也是一种图像压缩技术,jpg格式的图像文件可以以二级制数据流的形式直接存储在关系型数据库中,压缩后的图像数据相对于压缩前有较大的质量损失,以现有的技术无法从压缩后的数据恢复到压缩前的状态。
[0004]上述以jpg压缩技术为核心的图像压缩、图像存储、图像恢复流程,存在的缺陷是:jpg压缩是有损压缩,压缩率越高,图像质量的损失也就越严重,jpg图像的计算及存储的效率与图像质量不可兼顾,为了确保较高的计算效率以及占用较少的存储空间,而采用较高的压缩率,使得图像的质量损失严重,为了降低图像质量的损失而采用较低的压缩率,又会导致较低的计算效率以及占用更多的存储空间。其它常见的有损图像压缩技术也会存在类似的问题。
[0005]为了解决以jpg压缩技术为代表的传统图像压缩技术存在的上述缺陷,本专利创新性地提出了一种新的近似无损的图像压缩方法:设计一个
【技术保护点】
【技术特征摘要】
1.一种基于神经网络的数字档案馆图像压缩、存储、恢复方法,其特征在于,包括如下步骤:步骤1:将像素为H
×
W的3通道彩色图像的灰度矩阵转换成向量;步骤2:设计一个输入层与输出层神经元数量相同且隐含层的神经元的数量远小于输入层神经元数量的3层的全连接神经网络;步骤3:采集彩色图像数据,在训练数据上通过反向传播算法求解这个无约束优化问题,训练步骤2中设计的全连接神经网络;该神经网络的损失函数是输入与输出的误差平方和;该神经网络的训练目标是损失函数的最小化;步骤4:将待压缩的彩色图像输入步骤3训练好的全连接神经网络中,进行从输入层到隐含层的转换并提取对应的隐含层数据,得到压缩后的图像数据;步骤5:在关系型数据库中新建与隐含层的神经元的数量相同的浮点类型的数值型字段,将步骤四中得到的压缩后的图像数据进行存储;步骤6:将压缩后的图像数据,进行隐含层到输出层的转换,即可进行图像数据的恢复。2.根据权利要求1所述的基于神经网络的数字档案馆图像压缩、存储、恢复方法,其特征在于,所述步骤1的具体方法为:对像素为H
×
W的3通道彩色图像进行向量化处理;彩色图像的3个通道按照红绿蓝的排列顺序对应着3个尺寸均为H
×
W的灰度值矩阵R、G、B,将这三个矩阵依次按行展开成3个灰度值向量,每个向量的长度都是H
×
W,再把这三个向量拼接成一个长度为3
×
H
×
W的灰度值向量;将这个长为3
×
H
×
W的灰度值向量记为x。3.根据权利要求1所述的基于神经网络的数字档案馆图像压缩、存储、恢复方法,其特征在于,所述步骤2的具体方法为:设计一个3层的全连接神经网络,输入层和输出层的神经元的数量均是3
×
H
×
W,中间层的神经元的数量是M,为了达到压缩图像的目的,要求M远小于3
×
H
×
W;在对神经网络进行训练之前各层的参数都是未知的。4.根据权利要求3所述的基于神经网络的数字档案馆图像压缩、存储、恢复方法,其特征在于,所述为了确保较高的图像压缩率,M的值不超过3
×
H
×
W的1/10。5.根据权利要求3所述的基于神经网络的数字档案馆图像压缩、存储、恢复方法,其特征在于,所述3层的全连接神经网络,该神经网络的输入层到隐含层的转换过程为:设隐含层有M个神经元, M个神经元的非线性激活函数是:,则从输入层到隐含层的转换公式为:其中,行1列的矩阵存储隐含层个神经元的输出值,W是行列参数矩阵,b是行1列的参数矩阵,其中参数矩阵W、...
【专利技术属性】
技术研发人员:周力,余晓红,
申请(专利权)人:武汉搜优数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。