运动矢量处理制造技术

技术编号：17174436 阅读：57 留言：0更新日期：2018-02-03 07:46

实施例涉及针对来自多个摄像机视图(10，20)的多视图视频内容的运动矢量预测和解码。针对要编码的当前运动矢量(34)，提供至少一个候选运动矢量预测值(44，54)。然后，根据至少一个候选运动矢量预测值(44，54)来确定运动矢量预测值(44)。相应地，在解码期间，基于针对当前像素块(30)确定的运动矢量预测值(44)，针对当前像素块(30)确定运动矢量(34)。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】运动矢量处理
本实施例一般涉及运动矢量的处理，并且尤其涉及这种运动矢量的预测和解码。
技术介绍
H.264，也称运动图像专家组-4(MPEG-4)高级视频编码(AVC)，是现有视频编码标准。它是一种混合编解码器，利用消除帧间和一帧内的冗余，并使用若干提供良好的压缩效率的压缩技术。编码过程的输出是视频编码层(VCL)数据，该数据进一步封装成网络抽像层(NAL)单元，然后进行传输或存储。H.264是基于块的，也就是以宏块(MB)为单位处理视频帧，MB是16×16像素块，可被进一步划分为子宏块(sMB)。为了最小化要编码的数据量，对每个非帧内像素块执行称为运动补偿(MC)的技术，MC在相邻帧中使用先前重构的像素值来尽力而为地预测当前像素块的像素值。为了得到当前像素块的预测，在比特流中信号通知参考帧中与当前像素块相似的区域。最终重建可以通过将预测像素值与残差像素值加在一起来进行。为了找到参考帧中的当前像素块的最佳匹配，通常在编码器侧进行运动搜索。它试图找到当前像素块和可能的参考像素块之间的最小平方差之和(SSD)或绝对差和(SAD)。运动搜索的结果是信号通知其参考哪个参考帧的参考索引以及指向参考区域的偏移矢量，称为运动矢量(MV)。MV是视频比特流中的重要和开销成分。对于以高量化参数(QP)编码的视频，它可能占用超过50％的比特率。运动矢量编码MV不直接编码成比特流，因为可以利用MV之间的冗余。相邻MV往往具有较高的相关性，具有类似长度和方向的MV往往集群在一起。这些集群的MV可以对应于局部运动(其中对象移动)或全局运动(其中存在摇拍)。对于要编码的每个MV，首先...
运动矢量处理

【技术保护点】
一种用于来自多个摄像机视图(10，20)的视频内容的多视图视频编码的运动矢量预测的方法，所述方法包括：针对当前像素块(30)，估计(S1)所述多个摄像机视图(10，20)中的当前摄像机视图(20)的当前帧(24)中的运动矢量(34)，所述运动矢量(34)标识所述多个摄像机视图(10，20)中的所述当前摄像机视图(20)的参考帧(22)中的参考像素区域(32)，所述当前帧(24)具有当前画面顺序计数CurrPOC，所述参考帧(22)具有参考画面顺序计数CurrRfPOC；从多个预定义运动矢量类型中确定(S2)针对所述运动矢量(34)的运动矢量类型，其中，所述运动矢量类型是基于以下至少一项来确定的：i)所述多个摄像机视图(10，20)中的所述当前摄像机视图(20)和所述参考帧(22)的摄像机视图(20)，以及ii)所述当前帧(24)的时间点和所述参考帧(22)的时间点；标识(S3)所确定的运动矢量类型的至少一个候选运动矢量预测值(44，54，64)，其中所述至少一个候选运动矢量预测值(44，54，64)与具有第一画面顺序计数RfPOC的第一帧(24，14，16)中的像素块(40，50，60...

【技术特征摘要】
【国外来华专利技术】2011.08.19 US 61/525,2761.一种用于来自多个摄像机视图(10，20)的视频内容的多视图视频编码的运动矢量预测的方法，所述方法包括：针对当前像素块(30)，估计(S1)所述多个摄像机视图(10，20)中的当前摄像机视图(20)的当前帧(24)中的运动矢量(34)，所述运动矢量(34)标识所述多个摄像机视图(10，20)中的所述当前摄像机视图(20)的参考帧(22)中的参考像素区域(32)，所述当前帧(24)具有当前画面顺序计数CurrPOC，所述参考帧(22)具有参考画面顺序计数CurrRfPOC；从多个预定义运动矢量类型中确定(S2)针对所述运动矢量(34)的运动矢量类型，其中，所述运动矢量类型是基于以下至少一项来确定的：i)所述多个摄像机视图(10，20)中的所述当前摄像机视图(20)和所述参考帧(22)的摄像机视图(20)，以及ii)所述当前帧(24)的时间点和所述参考帧(22)的时间点；标识(S3)所确定的运动矢量类型的至少一个候选运动矢量预测值(44，54，64)，其中所述至少一个候选运动矢量预测值(44，54，64)与具有第一画面顺序计数RfPOC的第一帧(24，14，16)中的像素块(40，50，60)相关联，并标识具有第一参考画面顺序计数RfRfPOC的第一参考帧(22，26)中的像素区域(42，52，62)；以及基于所述至少一个候选运动矢量预测值(44，54，64)，确定(S4)针对所述运动矢量(34)的运动矢量预测值，其中，所述方法还包括：针对所述至少一个候选运动矢量预测值(44，54，64)，如果i)所述当前画面顺序计数等于所述参考画面顺序计数或ii)所述第一画面顺序计数等于所述第一参考画面顺序计数，则确定(S11)缩放因子为等于固定的预定义值，否则将所述缩放因子确定(S12)为基于以及针对所述至少一个候选运动矢量预测值(44，54，64)，基于所述候选运动矢量预测值(44，54，64)乘以所述缩放因子来确定(S13)缩放的候选运动矢量预测值，其中，确定(S4)所述运动矢量预测值包括：基于所述至少一个缩放的候选运动矢量预测值，确定(S4)针对所述运动矢量(34)的所述运动矢量预测值。2.根据权利要求1所述的方法，其中确定(S2)所述运动矢量类型包括：如果所述当前帧(24)的所述时间点不同于所述参考帧(22)的所述时间点，则将所述运动矢量类型确定为时间运动矢量类型；以及标识(S3)所述至少一个候选运动矢量预测值(44，54，64)包括：标识与第一帧(24，14)中的像素块(40，50)相关联并标识具有与所述第一帧(24)的时间点不同的时间点但属于所述多个摄像机视图(10，20)中与所述第一帧(24)相同的摄像机视图(20)的第一参考帧(22)中的像素区域(42)的至少一个候选运动矢量预测值(44，54)。3.根据权利要求1所述的方法，其中确定(S2)所述运动矢量类型包括：如果所述当前摄像机视图(20)不同于所述参考帧(22)的所述摄像机视图(20)，则将所述运动矢量类型确定为视图间运动矢量类型；以及标识(S3)所述至少一个候选运动矢量预测值(44，54，64)包括：标识与所述多个摄像机视图(10，20)中的第一摄像机视图(10，20)中的第一帧(14，26)中的像素块(50，60)相关联并标识具有与所述第一帧(26)的时间点相等的时间点但属于所述多个摄像机视图(10，20)中与所述第一摄像机视图(20)不同的摄像机视图(10)的第一参考帧(16)中的像素区域(62)的至少一个候选运动矢量预测值(54，64)。4.根据权利要求1至3中任一项所述的方法，其中，标识(S3)所述至少一个候选运动矢量预测值(44，54，64)包括：从基于所述当前像素块(30)在所述当前帧(24)中的位置、所述当前帧(24)的时间点和所述当前摄像机视图(20)而确定的多个候选运动矢量预测值(44，54，64)的集合中标识所述至少一个候选运动矢量预测值(44，54，64)。5.根据权利要求1至3中任一项所述的方法，还包括：基于所述运动矢量(34)和所述运动矢量预测值来计算残差运动矢量。6.根据权利要求1所述的方法，其中，估计(S1)所述运动矢量(34)包括：针对所述当前像素块(30)，估计(S1)标识所述多个摄像机视图(10，20)中的参考摄像机视图的所述参考帧(22)中的所述参考像素区域(32)的所述运动矢量(34)，所述当前摄像机视图(20)不同于所述参考摄像机视图(20)，所述至少一个候选运动矢量预测值(54，64)与所述多个摄像机视图(10，20)中的第一摄像机视图(10，20)的第一帧(14，16)中的像素块(50，60)相关联，并标识所述多个摄像机视图(10，20)中的第一参考摄像机视图(20，10)的第一参考帧(26)中的像素区域(52，62)，所述方法还包括：针对所述至少一个候选运动矢量预测值(54，64)，基于所述当前摄像机视图(20)和所述参考摄像机视图(20)之间的基线距离以及所述第一摄像机视图(10，20)和所述第一参考摄像机视图(20，10)之间的基线距离，确定(S20)缩放因子；以及针对所述至少一个候选运动矢量预测值(54，64)，基于所述候选运动矢量预测值(54，64)乘以所述缩放因子来确定(S21)缩放的候选运动矢量预测值，其中，确定(S4)所述运动矢量预测值包括：基于所述至少一个缩放的候选运动矢量预测值，确定(S4)针对所述运动矢量(34)的所述运动矢量预测值。7.根据权利要求6所述的方法，其中，确定(S20)所述缩放因子包括：针对所述至少一个候选运动矢量预测值(54，64)，基于所述当前摄像机视图(20)和所述参考摄像机视图(20)之间的基线距离与所述第一摄像机视图(10，20)和所述第一参考摄像机视图(20，10)之间的基线距离之间的商，确定所述缩放因子。8.一种存储计算机程序的计算机可读介质，当所述计算机程序在计算机(70)上运行时，使所述计算机(70)执行根据权利要求1至7中任一项所述的方法。9.一种用于来自多个摄像机视图(10，20)的视频内容的多视图视频编码的运动矢量预测的设备(100)，所述设备(100)包括：类型确定器(120)，被配置为从多个预定义运动矢量类型中确定针对运动矢量(34)的运动矢量类型，所述运动矢量(34)是针对所述多个摄像机视图(10，20)中的当前摄像机视图(20)的当前帧(24)中的当前像素块(30)来估计的，所述运动矢量(34)标识参考帧(22)中的参考像素区域(32)，其中，所述类型确定器(120)被配置为基于以下至少一项来确定所述运动矢量类型：i)所述多个摄像机视图(10，20)中的所述当前摄像机视图(20)和所述参考帧(22)的摄像机视图(20)，以及ii)所述当前帧(24)的时间点和所述参考帧(22)的时间点；预测值标识器(130)，被配置为标识所述类型确定器(120)所确定的运动矢量类型的至少一个候选运动矢量预测值(44，54，64)；以及预测值确定器(140)，被配置为基于所述预测值标识器(130)所标识的所述至少一个候选运动矢量预测值(44，54，64)，确定针对所述运动矢量(34)的运动矢量预测值，其中，所述设备还包括：运动矢量MV估计器(110)，被配置为针对所述当前像素块(30)，估计标识所述参考帧(22)中的所述参考像素区域(32)的所述运动矢量(34)，其中，所述MV估计器被配置为：针对所述当前像素块(30)，估计标识所述多个摄像机视图(10，20)中的参考摄像机视图(20)的所述参考帧(22)中的所述参考像素区域(32)的所述运动矢量(34)，所述当前帧(24)具有当前画面顺序计数CurrPOC，所述参考帧(22)具有参考画面顺序计数CurrRfPOC，所述至少一个候选运动矢量预测值(44，54，64)与具有第一画面顺序计数RfPOC的第一帧(24，14，16)中的像素块(40，50，60)相关联，并标识具有第一参考画面顺序计数RfRfPOC的第一参考帧(22，26)中的像素区域(42，52，62)，所述设备(100)还包括：缩放因子确定器(180)，被配置为针对所述至少一个候选运动矢量预测值(44，54，64)，如果i)所述当前画面顺序计数等于所述参考画面顺序计数或ii)所述第一画面顺序计数等于所述第一参考画面顺序计数，则确定缩放因子为等于固定的预定义值，否则将所述缩放因子确定为基于以及缩放预测值确定器(190)，被配置为针对所述至少一个候选运动矢量预测值(44，54，64)，基于所述候选运动矢量预测值(44，54，64)乘以所述缩放因子来确定(S13)缩放的候选运动矢量预测值，其中，所述预测值确定器(140)被配置为：基于所述至少一个缩放的候选运动矢量预测值，确定针对所述运动矢量(34)的所述运动矢量预测值。10.根据权利要求9所述的设备，其中所述类型确定器(120)被配置为：如果所述当前帧(24)的所述时间点不同于所述参考帧(22)的所述时间点，则将所述运动矢量类型确定为时间运动矢量类型；以及所述预测值标识器(130)被配置为：标识与第一帧(24，14)中的像素块(40，50)相关联并标识具有与所述第一帧(24)的时间点不同的时间点但属于所述多个摄像机视图(10，20)中与所述第一帧(24)相同的摄像机视图(20)的第一参考帧(22)中的像素区域(42)的至少一个候选运动矢量预测值(44，54)。11.根据权利要求9所述的设备，其中所述类型确定器(120)被配置为：如果所述当前摄像机视图(20)不同于所述参考帧(22)的所述摄像机视图(20)，则将所述运动矢量类型确定为视图间运动矢量类型；以及所述预测值标识器(130)被配置为：标识与所述多个摄像机视图(10，20)中的第一摄像机视图(10，20)中的第一帧(14，26)中的像素块(50，60)相关联并标识具有与所述第一帧(26)的时间点相等的时间点但属于所述多个摄像机视图(10，20)中与所述第一摄像机视图(20)不同的摄像机视图(10)的第一参考帧(16)中的像素区域(62)的至少一个候选运动矢量预测值(44，54)。12.根据权利要求9至11中任一项所述的设备，其中，所述预测值标识器(130)被配置为：从基于所述当前像素块(30)在所述当前帧(24)中的位置、所述当前帧(24)的时间点和所述当前摄像机视图(20)而确定的多个候选运动矢量预测值(44，54，64)的集合中标识所述至少一个候选运动矢量预测值(44，54，64)。13.根据权利要求9至11中任一项所述的设备，还包括：矢量计算器(170)，被配置为基于所述运动矢量(34)和所述运动矢量预测值来计算残差运动矢量。14.根据权利要求9所述的设备，其中，所述MV估计器(110)被配置为：针对所述当前像素块(30)，估计标识所述多个摄像机视图(10，20)中的参考摄像机视图(20)的所述参考帧(22)中的所述参考像素区域(32)的所述运动矢量(34)，所述当前摄像机视图(20)不同于所述参考摄像机视图(20)，所述至少一个候选运动矢量预测值(54，64)与所述多个摄像机视图(10，20)中的第一摄像机视图(10，20)的第一帧(14，16)中的像素块(50，60)相关联，并标识所述多个摄像机视图(10，20)中的第一参考摄像机视图(20，10)的第一参考帧(26)中的像素区域(52，62)，所述设备(100)还包括：缩放因子确定器(180)，被配置为针对所述至少一个候选运动矢量预测值(54，64)，基于所述当前摄像机视图(20)和所述参考摄像机视图(20)之间的基线距离以及所述第一摄像机视图(10，20)和所述第一参考摄像机视图(20，10)之间的基线距离，确定缩放因子；以及缩放预测值确定器(190)，被配置为针对所述至少一个候选运动矢量预测值(54，64)，基于所述候选运动矢量预测值(54，64)乘以所述缩放因子来确定(S21)缩放的候选运动矢量预测值，其中，所述预测值确定器(140)被配置为：基于所述至少一个缩放的候选运动矢量预测值，确定针对所述运动矢量(34)的所述运动矢量预测值。15.根据权利要求14所述的设备，其中，所述缩放因子确定器(180)被配置为：针对所述至少一个候选运动矢量预测值(54，64)，基于所述当前摄像机视图(20)和所述参考摄像机视图(20)之间的基线距离与所述第一摄像机视图(10，20)和所述第一参考摄像机视图(20，10)之间的基线距离之间的商，确定所述缩放因子。16.一种针对来自多个摄像机视图(10，20)的编码的多视图视频的运动矢量解码的方法，所述方法包括：针对所述多个摄像机视图(10，20)中的当前摄像机视图(20)的当前帧(24)中的当前像素块(30)，提供(S40)参考帧索引，所述参考帧索引标识参考帧(22)；基于以下至少一项，从多个预定义运动矢量类型中确定(S41)针对所述当前像素块(30)的运动矢量类型：i)所述多个摄...

【专利技术属性】
技术研发人员：巫壮飞，托马斯·卢瑟，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典,SE

全部详细技术资料下载我是这个专利的主人