三维视频编码的摄像机参数发信的方法和装置制造方法及图纸

技术编号:21719755 阅读:35 留言:0更新日期:2019-07-27 22:01
一种三维视频编码和解码方法,根据控制标记自适应地将摄像机参数合并到视频比特流中。基于与多个深度导向的编码工具相关的多个个别控制标记的组合可推导所述控制标记。另一个控制标记可以合并在视频比特流中,以指出当前层是否需要摄像机参数。在另一个实施例中,使用第一标记和第二标记以自适应地控制视频比特流中的每一层或每一视角的摄像机参数的存在和位置。第一标记指出视频比特流中的每一层或每一视角的摄像机参数是否存在。第二标记指出在视频流中每一层或每一视角的摄像机参数的位置。

Method and Device for Sending Camera Parameters in 3D Video Coding

【技术实现步骤摘要】
三维视频编码的摄像机参数发信的方法和装置相关申请的交叉引用本申请要求下列申请的优先权:2013年7月19日递交的申请号为61/856,321,名称为“三维视频编码的摄像机参数发信”的美国临时案;2013年7月30日递交的申请号为61/859,797,名称为“三维视频编码的自适应摄像机参数发信”的美国临时案;2013年7月31日递交的申请号为61/860,707,名称为“三维视频编码的摄像机参数发信的限制(Restriction)”的美国临时案;2013年10月14日递交的申请号为61/890,366,名称为“三维视频编码的摄像机参数发信的约束(Constraints)”的美国临时案;2013年10月15日递交的申请号为61/891,201,名称为“三维视频编码的摄像机参数发信”的美国临时案;2013年10月30日递交的申请号为61/897,364,名称为“三维视频编码的基于视角顺序索引的摄像机参数发信”的美国临时案。在此合并参考这些申请案的申请标的。
本专利技术有关于三维(three-dimensional,3D)视频编码。特别是,本专利技术有关于三维视频编码中的三维编码工具的摄像机参数发信。
技术介绍
三维电视一直是近几年的技术趋势,意图给观众带来非常好的观看体验。目前已经开发出了多种支持三维观看的技术。其中,对于三维电视应用程序而言,多视角视频(multi-viewvideo)是关键技术之一。传统的视频是二维(2D)媒体,仅为观众提供从摄像机的角度看到的单一视角(singleview)。然而,多视角视频能够提供动态场景的任意视点(arbitraryviewpoints),并提供给观众以真实感。多视角视频通常是通过使用多个摄像机同时捕获一个场景而产生的,其中多个摄像机都被设置在适当的位置,以使每个摄像机从一个视点捕捉场景。因此,多个摄像头捕捉到相应于多个视角的多个视频序列。为了提供更多的视角,更多的摄像头已被用来产生与多个视角相关的大量的视频序列。因此,多视角视频将需要很大的存储空间以存储和/或需要高带宽以传输。因此,在该领域中多视角视频编码技术已经已被开发出来,以减少所需的存储空间或传输带宽。一个简单的方法是,简单地将传统的视频编码技术分别适用于每个单一视角视频序列,并忽略多个不同视角之间的任何相关。这样的编码系统将是非常低效的。为了提高多视角视频编码的效率,多视角视频编码利用视角间冗余(inter-viewredundancy)。多种3D编码工具正在以扩展现有视频编码标准的方式来开发中。例如,标准开发活动已扩展H.264/先进视频编码(advancedvideocoding,AVC)和高效视频编码(highefficiencyvideocoding,HEVC)至多视角视频编码(multi-viewvideocoding,MVC)和3D编码。用于3D-HEVC和3D-AVC的各种已开发或正在开发的3D编码工具如下。分享相邻视角的先前编码的纹理信息(previouslycodedtextureinformation),被称为视差补偿预测(Disparity-CompensatedPrediction,DCP)的技术已被列入3D-HTM,作为运动补偿预测(motion-compensatedprediction,MCP)的另一种编码工具。MCP是指利用相同视角的先前编码图像的图像间预测(inter-pictureprediction),而DCP指使用相同存取单元中其他视角的先前编码图像的图像间预测。图1为合并MCP和DCP的3D视频编码系统的示意图。用于DCP的矢量(110)被称为视差矢量(disparityvector,DV),这是模拟MCP中使用的运动矢量(motionvector,MV)。图1说明了与MCP相关的三个运动矢量(120、130和140)。此外,DCP块的视差矢量也可以由来自于相邻块或时间轴上同位块(temporalcollocatedblocks)有利用视角间参考图像的视差矢量预测器(disparityvectorpredictor,DVP)候选来预测。在当前的3D-HTM中,当为合并/跳跃模式(Merge/Skipmodes)获得视角间合并模式候选(inter-viewMergecandidate)时,如果相应的块的运动信息不可用或无效,视角间合并模式候选被视差矢量所取代。视角间残差预测(Inter-viewresidualprediction)是另一个用于3D-HTM的编码工具。如图2所示,为了分享相邻视角的先前编码的残差信息,当前预测块(即,预测单元(predictionunit,PU))的残差信号,可以通过视角间图像中的相应的块的残差信号来预测。相应的块可以通过各自的视差矢量来定位。相应于特定摄像机位置的视频图像和深度图(depthmap)是由视角标识符(viewidentifier)来指出(indicate)的(例如,图2中的V0、V1和V2)。属于相同摄像机位置的所有视频图像和深度图,都与相同的视角索引(viewindex)(即,视角顺序索引)相关。视角顺序索引用于指定存取单元内的编码顺序,以及在易于出错的环境(error-proneenvironment)中检测丢失的视角。存取单元包括相应于相同时刻(sametimeinstant)的所有视频图像和深度图。在存取单元中,视角索引等于0的视频图像和存在的相关深度图会最先编码,接下来是视角索引等于1的视频图像和深度图,以此类推。视角索引等于0的视角(即,图2中的V0)也被称为基本视角或独立视角。基本视角视频图像可以不依赖其他视角而使用常规的HEVC视频编码器来进行编码。在图2中可以看到,对于当前块,运动矢量预测器(MVP)/视差矢量预测器(DVP)可以从视角间图像中的视角间块(inter-viewblock)来得到。在下面,视角间图像中的视角间块可以简写为视角间块。得到的候选被称为视角间候选(inter-viewcandidate),可作为视角间MVP和DVP。基于其他视角中先前编码的运动信息,编码工具编码当前块(例如,当前的预测单元)的运动信息,被称为视角间运动参数预测。此外,在相邻视角中的相应的块被称为视角间块,视角间块使用从当前图像的当前块的深度信息得到的视差矢量来定位。图2所示的实施例相应的视角编码顺序为从V0(即,基础视角)到V1,再到V2。在当前图像中被编码的当前块是V2。根据HTM3.1,在先前编码视角中的参考块的所有运动矢量可以被视为视角间候选,即使视角间图像不在当前图像的参考图像列表中。在图2中,帧210、220和230分别相应于在时间t1来自于视角V0、V1和V2的视频图像或深度图。块232是当前视角中的当前块,块212和块222分别为视角V0和V1中的同位当前块(collocatedcurrentblock)。对于视角V0中的同位当前块212,视差矢量216用于定位视角间同位块214。同样,对于视角V1中的同位当前块222,视差矢量226用于定位视角间同位块224。在3D系统中,在参考视角中的深度图可以在相依视角(dependentview)中的纹理图像之前被编码。因此,对于后续的纹理和深度本文档来自技高网...

【技术保护点】
1.一种视频解码器解码三维视频数据的方法,其特征在于,该方法包括:接收与压缩的三维视频数据相关的视频比特流;为每一层或每一视角确定第一标记,其中所述第一标记指出所述每一层或每一视角中的摄像机参数在所述视频比特流中是否存在;为所述每一层或每一视角确定第二标记,其中所述第二标记指出所述视频比特流中所述每一层或每一视角的摄像机参数位置;如果所述第一标记指出所述每一层或每一视角中存在所述摄像机参数,从所述摄像机参数位置推导所述视频比特流中的所述每一层或每一视角的所述摄像机参数;使用所述每一层或每一视角的所述摄像机参数,从所述视频比特流解码所述每一层或每一视角的当前纹理数据或深度数据;以及提供解码的当前纹理数据或深度数据。

【技术特征摘要】
2013.07.19 US 61/856,321;2013.07.30 US 61/859,797;1.一种视频解码器解码三维视频数据的方法,其特征在于,该方法包括:接收与压缩的三维视频数据相关的视频比特流;为每一层或每一视角确定第一标记,其中所述第一标记指出所述每一层或每一视角中的摄像机参数在所述视频比特流中是否存在;为所述每一层或每一视角确定第二标记,其中所述第二标记指出所述视频比特流中所述每一层或每一视角的摄像机参数位置;如果所述第一标记指出所述每一层或每一视角中存在所述摄像机参数,从所述摄像机参数位置推导所述视频比特流中的所述每一层或每一视角的所述摄像机参数;使用所述每一层或每一视角的所述摄像机参数,从所述视频比特流解码所述每一层或每一视角的当前纹理数据或深度数据;以及提供解码的当前纹理数据或深度数据。2.如权利要求1所述的视频解码器解码三维视频数据的方法,其特征在于,在所述视频比特流中的所述摄像机参数被合并在所述视频比特流的序列层级、视角层级、图象层级或片段层级。3.如权利要求1所述的视频解码器解码三维视频数据的方法,其特征在于,所述摄像机参数位于片段头,其中所述摄像机参数位置是从所述第一标记和所述第二标记的逻辑组合推导的。4.如权利要求1所述的视频解码器解码三维视频数据的方法,其特征在于,多个第二标记用于指出所述每一层或每一视角的在所述视频比特流中的多个摄像机参数位置。5.如权利要求4所述的视频解码器解码三维视频数据的方法,其特征在于,所述多个第二个标记是从所述每一视角的多个第一标记推导的。6.如权利要求5所述的视频解码器解码三维视频数据的方法,其特征在于,如果选定的视角不存在所述摄像机参数,所述选定的视角的所述第一标记被推断为0。7.如权利要求1所述...

【专利技术属性】
技术研发人员:张毓麟陈渏纹林建良
申请(专利权)人:寰发股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1