The invention discloses an image encoding method, disparity estimation based on light field including: light field image is converted to pseudo video sequence; in encoding, prediction between pseudo video sequence encoding frame and the current frame optical flow information using the depth of the neural network, and convert it to a poor visual information, and then the movement the compensation, and calculate the residuals; finally, the residual quantization encoding write stream; in decoding, and encoding method using same, the depth of the neural network prediction between the decoded frame and the current frame optical flow information, and converts it to a corresponding motion vector decoding block, the motion compensation to get the current decoding block prediction the stream of blocks, the residual information building block reconstruction. This method can save the time of motion estimation and reduce the number of bits for encoding motion vector, improve light field image compression performance, and we do not need to write the motion information stream, can greatly reduce the bandwidth required to transmit video information.
【技术实现步骤摘要】
基于视差预测的光场图像编码方法
本专利技术涉及视频编码
,尤其涉及一种基于视差预测的光场图像编码方法。
技术介绍
光场相机不但可以记录空间场景中的光线强度,而且还能记录其方向信息,随着Lytro光场相机的推出,光场图像在立体显示、虚拟现实、深度计算等领域有着巨大的应用前景。对于光场图像,我们可以将其转换为一组子孔径图像(subapertureimage),各个子孔径图像存在微小的视差,因此它们的信息冗余度非常大。如何利用子孔径图像间的视差对其进行高效地压缩,是光场技术应用过程中亟待解决的问题。目前,如下两种方案:1)将视差补偿结合到小波变换中,但是该方法不能和现有的基于块结构的混合编码框架进行有效结合,并且该方法无法支持实时操作;2)则利用投影映射对子孔径图像间的视角变换进行建模,但是由于特征点检测精度的问题,导致其压缩性能不高。另一方面,虽然光场中的视差信息可以通过计算运动矢量的方法得到,但是目前的计算过程涉及到运动估计,其时间复杂度较高,而且编码这些运动矢量要花费大量的比特。
技术实现思路
本专利技术的目的是提供一种基于视差预测的光场图像编码方法,可以节省运动估计的时间,降低编码运动矢量的比特数,提高光场图像的压缩性能。本专利技术的目的是通过以下技术方案实现的:一种基于视差预测的光场图像编码方法,包括:将光场图像转换为伪视频序列;在编码端,利用深度神经网络预测伪视频序列中已编码帧和当前帧之间的光流信息,并将其转换为视差信息,即对应编码块的运动矢量,然后进行运动补偿,并计算残差;最后,将残差量化编码写入码流;在解码端,采用与编码端一致的方法,利用深度神 ...
【技术保护点】
一种基于视差预测的光场图像编码方法,其特征在于,包括:将光场图像转换为伪视频序列;在编码端,利用深度神经网络预测伪视频序列中已编码帧和当前帧之间的光流信息,并将其转换为视差信息,即对应编码块的运动矢量,然后进行运动补偿,并计算残差;最后,将残差量化编码写入码流;在解码端,采用与编码端一致的方法,利用深度神经网络预测已解码帧和当前帧之间的光流信息,并将其转换为对应解码块的运动矢量,通过运动补偿得到当前解码块的预测块,最后利用码流中的残差信息构建重建块。
【技术特征摘要】
1.一种基于视差预测的光场图像编码方法,其特征在于,包括:将光场图像转换为伪视频序列;在编码端,利用深度神经网络预测伪视频序列中已编码帧和当前帧之间的光流信息,并将其转换为视差信息,即对应编码块的运动矢量,然后进行运动补偿,并计算残差;最后,将残差量化编码写入码流;在解码端,采用与编码端一致的方法,利用深度神经网络预测已解码帧和当前帧之间的光流信息,并将其转换为对应解码块的运动矢量,通过运动补偿得到当前解码块的预测块,最后利用码流中的残差信息构建重建块。2.根据权利要求1所述的一种基于视差预测的光场图像编码方法,其特征在于,所述将光场图像转换为伪视频序列包括:将光场图像转换为子孔径图像阵列,每幅子孔径图像反映了不同视角的场景信息;将子孔径图像阵列按照一定的顺序将其转换为伪视频...
【专利技术属性】
技术研发人员:陈志波,赵盛洋,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。