The image compression system of the convolution neural network based on the dynamic byte length allocation belongs to the field of image compression technology. The image compression system: byte length distribution network intermediate characteristics of convolutional coder, namely the byte length feature as its input, establish the byte length distribution of the image to be compressed based on content, and according to the byte length distribution set byte length distribution diagram template. The two value device converts the initial encoding feature of the convolutional encoder to the coded two value feature graph, that is, the discrete encoding. Before entering the discrete convolution entropy encoder, encoding and first byte length distribution diagram template by cutting. Therefore, for the image compression system described in the invention, the discrete coding of the entropy coding is changed with the change of the local information content of the compressed image, and the matching degree of the image compression system with the compressed image is higher, and the compression effect is better. The image compression system described in the present invention is suitable for compression and decompression of the image.
【技术实现步骤摘要】
基于动态字节长度分配的卷积神经网络的图像压缩系统
本专利技术涉及一种图像压缩系统,属于图像压缩
技术介绍
图像压缩是计算机视觉和图像处理领域中的一项基本问题。随着高质量的多媒体内容的发展和流行,图像的有损压缩在节省传输带宽和硬件存储上变得愈发重要。图像压缩系统通常包括编码器、量化器和解码器三部分,这三部分构成了媒体数字信号编解码器。对于典型的图像编码标准,例如JPEG和JPEG2000,二者通常依赖于手动设计的编码器进行图像转换和离散优化。因此,对于图像压缩来说,这类图像编码标准并非最佳标准。除此之外,JPEG和JPEG2000对低比率图像的压缩性能较差,在对图像进行压缩的过程中,会不可避免地产生视觉上的非自然信号,例如模糊、振铃及块效应等。基于上述问题,近年来,学者们尝试将卷积神经网络应用到图像压缩领域中,并取得了比JPEG和JPEG2000更好的压缩效果。因为对图像的编码和解码来说,卷积神经网络能够很容易地通过堆叠几层卷积层来实现灵活的非线性分析和合成转换,并能够端对端地联合优化非线性编码器和解码器。但是,现有基于卷积神经网络的图像压缩方法仍然存在着 ...
【技术保护点】
基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,所述图像压缩系统包括卷积码编码器、字节长度分配图网络、二值器、点乘计算器、卷积熵编码器和卷积码解码器;卷积码编码器包括卷积层C1~卷积层CN+1和残差块R1~残差块RN,卷积层和残差块依次间隔设置,卷积层C1的输入端和卷积层CN+1的输出端分别为卷积码编码器的待压缩图像输入端和初步编码特征图输出端,残差块RN的第一输出端为卷积码编码器的字节长度特征输出端,残差块RN的第二输出端与卷积层CN+1的输入端相连;字节长度分配图网络的字节长度特征输入端和字节长度分配图模板输出端分别与卷积码编码器的字节长度特征输出端和点乘 ...
【技术特征摘要】
1.基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,所述图像压缩系统包括卷积码编码器、字节长度分配图网络、二值器、点乘计算器、卷积熵编码器和卷积码解码器;卷积码编码器包括卷积层C1~卷积层CN+1和残差块R1~残差块RN,卷积层和残差块依次间隔设置,卷积层C1的输入端和卷积层CN+1的输出端分别为卷积码编码器的待压缩图像输入端和初步编码特征图输出端,残差块RN的第一输出端为卷积码编码器的字节长度特征输出端,残差块RN的第二输出端与卷积层CN+1的输入端相连;字节长度分配图网络的字节长度特征输入端和字节长度分配图模板输出端分别与卷积码编码器的字节长度特征输出端和点乘计算器的第一输入端相连;字节长度分配图网络用于根据卷积码编码器发来的字节长度特征建立基于图像内容的字节长度分配图,并根据该字节长度分配图建立字节长度分配图模板;二值器的初步编码特征图输入端和编码二值特征图输出端分别与卷积码编码器的初步编码特征图输出端和点乘计算器的第二输入端相连;卷积熵编码器用于对点乘计算器的输出结果和字节长度分配图进行无损熵编码,得到压缩图像;卷积码解码器用于对压缩图像进行解压;N∈[2,3,4,5,6]。2.如权利要求1所述的基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,N=3;卷积层C1用于对待压缩图像依次进行第一次卷积操作和第一次激活操作;残差块R1用于对第一次激活操作的输出结果依次进行第二次卷积操作、第二次激活操作、第三次卷积操作和第三次激活操作,并将第三次激活操作的输出结果与第一次激活操作的输出结果进行点加操作,并对点加结果进行第四次激活操作;卷积层C2用于对第四次激活操作后的点加结果依次进行第四次卷积操作和第五次激活操作;残差块R2用于对第五次激活操作的输出结果依次进行第五次卷积操作、第六次激活操作、第六次卷积操作和第七次激活操作,将第七次激活操作的输出结果与第五次激活操作的输出结果进行点加操作,并对点加结果进行第八次激活操作;卷积层C3用于对第八次激活操作后的点加结果进行第七次卷积操作和第九次激活操作;残差块R3用于对第九次激活操作的输出结果依次进行第八次卷积操作、第十次激活操作、第九次卷积操作和第十一次激活操作,将第十一次激活操作的输出结果与第九次激活操作的输出结果进行点加操作,并对点加结果进行第十二次激活,第十二次激活操作后的点加结果为字节长度特征;卷积层C4用于对第十二次激活操作后的点加结果依次进行第十次卷积操作和第十三次激活操作,对第十三次激活操作的输出结果进行量化,得到初步编码特征图;第一次卷积操作为128个8*8、步长为4的卷积操作;第二次卷积操作、第三次卷积操作、第五次卷积操作和第八次卷积操作均为128个3*3、步长为1的卷积操作;第四次卷积操作为256个4*4、步长为2的卷积操作;第六次卷积操作、第七次卷积操作和第九次卷积操作均为256个3*3、步长为1的卷积操作;第十次卷积操作为M个1*1、步长为1的卷积操作,当所述图像压缩系统的压缩率小于0.5bpp时,M=64,否则,M=128;第一次激活操作至第十二次激活操作均采用ReLU函数,第十三次激活操作采用Sigmoid函数。3.如权利要求2所述的基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,字节长度分配图网络包括卷积层C5和卷积层C6;卷积层C5用于对第十二次激活操作后的点加结果依次进行第十一次卷积操作和第十四次激活操作;卷积层C6用于对第十四次激活操作的输出结果依次进行第十二次卷积操作和第十五次激活操作;量化后的第十五次激活操作的输出结果为字节长度分配图;第十一次卷积操作为128个3*3、步长为1的卷积操作;第十二次卷积操作为1个1*1、步长为1的卷积操作;第十四次激活操作采用ReLU函数;第十五次激活操作采用Sigmoid函数。4.如权利要求3所述的基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,在卷积神经网络前向传播时,采用B(eijk)函数定义编码二值特征图中的元素:在卷积神经网络反向传播时,定义函数计算二值操作梯度:式中,eijk为初步编码特征图中的元素。5.如权利要求4所述的基于动态字节长度分配的卷积神经网络的图像压缩系统,其特征在于,字节长度分配图网络根据卷积码编码器发来的字节长度特征建立基于图像内容的字节长度分配图,并根据该字节长度分配图建立字节长度分配图模板的具体过程为:S1、由卷积层C5和卷积层C6构成的两层卷积网络根据接收到的第十二次激活操作后的点加结果,得到字节长度分配特征;S2、对字节长度分配特征进行取整操作,并采用Q(pij)函数定义字节长度分配特征的取整操作:2式中,pij为字节长度分配特征,l和L均为正整数,l为分配给取整后的pij的字节数,L为字节长度等级数,每个字节长度等级对应个字节,n为卷积码编码器的初步编码特征图的输出通道数,n为L的整数倍;根据取整后的字节长度分配特征建立基于图像内容的字节长度分配图p,字节长度分配图p的尺寸为h*w,h为高度,w为宽度;S3、根据字节长度分配图p,建立字节长度分配图模板m,其尺寸为n*h*w;在卷积神经网络前向传播时,定义字节...
【专利技术属性】
技术研发人员:左旺孟,李穆,顾舒航,李晓明,赵德斌,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。