视频编码装置和方法、视频解码装置和方法、以及它们的程序制造方法及图纸

技术编号：13674648 阅读：78 留言：0更新日期：2016-09-08 00:01

基于从针对多视点视频中的被摄体的深度图所设定的代表深度来设定将作为该多视点视频的1帧的编码对象图像上的位置向针对与编码对象图像不同视点的参照视点图像上的位置进行变换的变换矩阵。在分割了所述编码对象图像的编码对象区域内设定代表位置，使用该代表位置和所述变换矩阵来设定针对所述代表位置的所述参照视点图像上的对应位置。基于该对应位置从所述参照视点图像的运动信息生成所述编码对象区域中的合成运动信息，使用其来生成针对所述编码对象区域的预测图像。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及视频编码装置、视频解码装置、视频编码方法、视频解码方法、视频编码程序、以及视频解码程序。
技术介绍
自由视点视频是指用户能够自由地指定拍摄空间内的摄像机的位置、方向（以下，称为视点）的视频。在自由视点视频中，用户指定任意的视点，但是，不能保持针对可能的全部视点的视频。因此，自由视点视频由生成所指定的视点的视频所需要的信息组构成。再有，自由视点视频有时也称为自由视点电视、任意视点视频、任意视点电视等。自由视点视频使用各种数据形式来表现，但是，作为最一般的形式，存在使用视频和针对该视频的各帧的深度图（距离图像）的方式（例如，参照非专利文献1）。在此，深度图按照每个像素表现从摄像机到被摄体的深度（距离），表现被摄体的三维的位置。在满足某种条件的情况下，深度与两个摄像机间的视差的倒数成比例，因此，有时也称为视差图（视差图像）。在计算机图形学的领域中，深度为存储在Z缓冲器中的信息，因此，有时也称为Z图像、Z图。再有，除了从摄像机到被摄体的距离之外，有时也将针对在表现对象空间上设置的三维坐标系的Z轴的坐标值用作深度。一般地，针对所拍摄的图像而将水平方向作为X轴、将垂直方向作为Y轴，因此，Z轴与摄像机的方向一致，但是，在针对多个摄像机使用共同的坐标系的情况下等，也存在Z轴与摄像机的方向不一致的情况。在以下，不区别距离/Z值而称为深度，将把深度表示为像素值的图像称为深度图。但是，严密地，在视差图中，需要设定成为基准的摄像机对。在将深度表示为像素值时，存在将与物理量对应的值直接作为像素值的方法、使用将最小值和最大值之间量化为某数而得到的值的方法、以及使用用某...

【技术保护点】
一种视频编码装置，在对作为由多个不同的视点的视频构成的多视点视频的1帧的编码对象图像进行编码时，按照作为分割了所述编码对象图像的区域的每个编码对象区域一边在不同的视点间进行预测一边进行编码，所述视频编码装置的特征在于，具有：代表深度设定单元，从针对所述多视点视频中的被摄体的深度图设定代表深度；变换矩阵设定单元，基于所述代表深度来设定将所述编码对象图像上的位置向与该编码对象图像不同的针对参照视点的参照视点图像上的位置进行变换的变换矩阵；代表位置设定单元，从所述编码对象区域内的位置设定代表位置；对应位置设定单元，使用所述代表位置和所述变换矩阵来设定针对所述代表位置的所述参照视点图像上的对应位置；运动信息生成单元，基于所述对应位置根据作为所述参照视点图像的运动信息的参照视点运动信息来生成所述编码对象区域中的合成运动信息；以及预测图像生成单元，使用所述合成运动信息来生成针对所述编码对象区域的预测图像。

【技术特征摘要】
【国外来华专利技术】2013.12.03 JP 2013-2504291.一种视频编码装置，在对作为由多个不同的视点的视频构成的多视点视频的1帧的编码对象图像进行编码时，按照作为分割了所述编码对象图像的区域的每个编码对象区域一边在不同的视点间进行预测一边进行编码，所述视频编码装置的特征在于，具有：代表深度设定单元，从针对所述多视点视频中的被摄体的深度图设定代表深度；变换矩阵设定单元，基于所述代表深度来设定将所述编码对象图像上的位置向与该编码对象图像不同的针对参照视点的参照视点图像上的位置进行变换的变换矩阵；代表位置设定单元，从所述编码对象区域内的位置设定代表位置；对应位置设定单元，使用所述代表位置和所述变换矩阵来设定针对所述代表位置的所述参照视点图像上的对应位置；运动信息生成单元，基于所述对应位置根据作为所述参照视点图像的运动信息的参照视点运动信息来生成所述编码对象区域中的合成运动信息；以及预测图像生成单元，使用所述合成运动信息来生成针对所述编码对象区域的预测图像。2.根据权利要求1所述的视频编码装置，其特征在于，还具有深度区域设定单元，其针对所述编码对象区域设定作为所述深度图上的对应区域的深度区域，所述代表深度设定单元从针对所述深度区域的所述深度图设定代表深度。3.根据权利要求2所述的视频编码装置，其特征在于，还具有深度参照视差矢量设定单元，其针对所述编码对象区域设定作为针对所述深度图的视差矢量的深度参照视差矢量，所述深度区域设定单元将由所述深度参照视差矢量所示的区域设定为所述深度区域。4.根据权利要求3所述的视频编码装置，其特征在于，所述深度参照视差矢量设定单元使用在对与所述编码对象区域邻接的区域进行编码时使用的视差矢量来设定所述深度参照视差矢量。5.根据权利要求2所述的视频编码装置，其特征在于，所述代表深度设定单元将具有四角形状的所述编码对象区域的4个顶点的像素所对应的所述深度区域内的深度之中的、示出最靠近摄像机的深度设定为代表深度。6.根据权利要求1所述的视频编码装置，其特征在于，还具有合成运动信息变换单元，其使用所述变换矩阵来变换所述合成运动信息，所述预测图像生成单元使用所述变换后的合成运动信息。7.根据权利要求1所述的视频编码装置，其特征在于，还具有：过去深度设定单元，基于所述对应位置和所述合成运动信息来从所述深度图设定过去深度；逆变换矩阵设定单元，基于所述过去深度来设定将所述参照视点图像上的位置向所述编码对象图像上的位置进行变换的逆变换矩阵；以及合成运动信息变换单元，使用所述逆变换矩阵来变换所述合成运动信息，所述预测图像生成单元使用所述变换后的合成运动信息。8.一种视频解码装置，在从由多个不同的视点的视频构成的多视点活动图像的码数据对解码对象图像进行解码时，按照作为分割了所述解码对象图像的区域的每个解码对象区域一边在不同的视点间进行预测一边进行解码，所述视频解码装置的特征在于，具有：代表深度设定单元，从针对所述多视点视频中的被摄体的深度图设定代表深度；变换矩阵设定单元，基于所述代表深度来设定将所述解码对象图像上的位置向与该解码对象图像不同的针对参照视点的参照图像上的位置进行变换的变换矩阵；代表位置设定单元，从所述解码对象区域内的位置设定代表位置；对应位置设定单元，使用所述代表位置和所述变换矩阵来设定针对所述代表位置的所述参照视点图像上的对应位置；运动信息生成单元，基于所述对应位置根据作为所述参照视点图像的运动信息的参照视点运动信息来生成所述解码对象区域中的合成运动信息；以及预测图像生成单元，使用所述合成运动信息来生成针对所述解码对象区域的预测图像。9.根据权利要求8所述的视频解码装...

【专利技术属性】
技术研发人员：志水信哉，杉本志织，小岛明，
申请(专利权)人：日本电信电话株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人