对视频数据和视频信号进行编码和解码的方法及装置制造方法及图纸

技术编号:3611699 阅读:157 留言:0更新日期:2012-04-11 18:40
本发明专利技术的目的是提供一种技术,用来灵活、有效地对视频数据进行编码。这种技术要对叫做基层帧的一部分视频数据进行编码,以及对视频数据和预测信号产生的剩余图像进行编码。每个视频帧的预测是利用多个译码后的基层帧产生的,可以利用运动补偿。这些剩余图像叫做增强层帧,随后被编码。在这一技术的基础之上,由于采用了周围的一些基层帧,因此能够获得更好的预测。由于增强层帧中得到的剩余数据很少,因此能够对它们进行有效的编码。对于增强层帧的编码,可以采用精细颗粒可伸缩性技术(比如离散余弦变换编码或者小波编码)。译码过程是编码过程的相反过程。因此,能够灵活同时有效地对视频数据进行编码和译码。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

技术介绍
总的来说,本专利技术涉及视频压缩技术,具体而言,本专利技术涉及采用多个基层帧(base layer frames)来产生每一个增强层帧的一种伸缩结构。可伸缩视频编码技术是许多多媒体应用和业务所需要的一种功能。例如,视频伸缩性被用于采用具有大范围处理能力的译码器的系统中。在这种情况下,计算能力低的处理器只对可伸缩视频流的一个子集进行译码。可伸缩视频技术的另一种应用是可变传输带宽环境。在这种情况下,带宽较窄的接收机只对可伸缩视频流的一个子集进行接收和译码,其中这个可伸缩视频流的这个子集的大小正比于可以获得的带宽。MPEG-2和MPEG-4这样的主流视频压缩标准采用了几种视频可伸缩性方法。在这些标准中规定了时间、空间和质量(SNR)可伸缩性类型。所有这些方法都包括一个基层(BL)和一个增强层(EL)。总的来说,可伸缩视频流的基层部分代表对视频类进行译码所需要的最少的数据。视频流的增强层部分是接收器译码的时候用来增强视频信号的额外信息。用于对静止图像进行编码的另外一类可伸缩性是精细颗粒可伸缩性(FGS)。用这种可伸缩性技术编码的图像被逐步译码。换句话说,译码器在接收完对这一图像进行编码的所有数据之前就开始对这个图像进行译码和显示。随着收到的数据越来越多,译码后图像的质量逐渐提高,直到用于对这个图像进行编码的所有数据被收到、译码和显示。在MPEG-4中正在对视频信号精细颗粒可伸缩性进行标准化,MPEG-4就是下一代多媒体国际标准。在这种可伸缩性结构里,在基层中象其它普通视频可伸缩性方法中一样使用运动预测编码技术。对于每一编码基层帧,随后利用精细颗粒可伸缩性方法对一个剩余图像进行计算和编码,产生一个增强层帧。这种结构消除了增强层帧之间的依赖性,因而具有精细颗粒可伸缩性,同时充分利用了基层中进行预测的优点,因而能够提高编码效率。附图说明图1画出了FGS结构的一个实例。如图所示,这个结构还包括一个基层和一个增强层。此外,每一个增强帧都是从同一时刻的原始基层帧产生的。这一点由从每个基层帧向上指向对应的增强层帧的箭头反映出来。图2画出了FGS编码系统的一个实例。这个系统包括一个网络6,它的带宽在(Bmin=Rmin,Bmax=Rmax)这个范围内可变。还画出了一个计算功能框4,这个功能框用于估计或者测量当前可用带宽(R)。此外,基层(BL)视频编码器8利用(Rmin,R)范围内的比特率(RBL)对视频源2出来的信号进行压缩。在典型情况下,基层编码器8利用最小比特率(Rmin)对信号进行压缩。当基层在发送视频信号之前就以离线形式进行基层编码的情况下尤其如此。可以看出,图中的单元10用于计算剩余图像12。增强层(EL)编码器14以比特率RBL对剩余信号12进行压缩,这个比特率可以在RBL到Rmax-RBL的范围之内。注意到视频信号(增强层和基层)的编码既可以实时进行(如同图中所暗示的一样),又可以在传送图像之前以离线方式进行,这一点是非常重要的。在后一种情形中,如图所示,视频信号可以储存起来,然后晚些时候在一个实时速率控制器16的控制下发送(或者传送)。实施控制器16将当前(实时)可用带宽R考虑在内,选择最佳的质量增强层信号。因此,速率控制器16输出的增强层信号的比特率等于R-RBL。专利技术简述本专利技术的目的是对输入的视频数据进行灵活同时高效编码的一种技术。该方法要对叫做基层帧和增强层帧的一部分视频数据进行编码。用MPEG-4或者MPEG-2这种运动补偿DCT编码技术中的任意一种对基层帧进行编码。剩余图像是通过从输入的视频数据中减去预测信号产生的。根据本专利技术,预测是从有或者没有运动补偿的多个译码基层帧形成的,在这里的编码流中包括了模式选择判决。由于这种预测非常有效,剩余图像数据相对较少。然后用精细颗粒可伸缩性(比如DCT变换编码或者小波编码)对叫做增强层帧的剩余图像进行编码。这样就能够实现对视频数据的灵活而且高效的编码。本专利技术还提供一种方法,它翻转前面对视频数据的编码过程,产生译码后的帧。编码后的数据包括两部分,基层和增强层。该方法包括基层,它的译码方法取决于编码方法(编码器那里选择的MPEG-2或者MPEG-4),从而产生译码后的基层视频帧。还有,要译码的增强层取决于精细颗粒可伸缩性(比如编码器那里选择的离散余弦变换编码或者小波编码),以此来产生增强层帧。对于编码流中的模式判决信息,从多个译码后基层视频帧中选择出来的帧被用来产生预测信号,而不管有还是没有运动补偿。然后在译码基层视频帧中增加预测来产生译码输出视频数据。由于相邻图片具有很强的时间相关性,除了对应的基层编码帧以外,与某个原始图像有关的信息还驻留在其它帧内,注意到这一点是非常重要的。例如,前面的基层帧的压缩质量可能比当前帧高,并且这两个原始图片之间的时间相关性非常强。在这种情况下,有可能是前面的基层帧比当前基层帧携带了更多的当前原始图片信息。因此,最好是利用前面一个基层帧来计算这个图片的增强层信号。如同前面参考图1所作的讨论一样,当前FGS结构从对应的当前基层帧产生每一个增强层帧。虽然不是那么复杂,这种结构无法充分利用基层帧附近更大范围内能够获得的信息,而它能够产生更好的增强信号。因此,根据本专利技术,与当前基层帧相比,利用基层图片周围的信息可以为任意图片产生增强层帧。通过下面的数学公式来说明当前可伸缩结构和新的可伸缩结构之间的差别。当前的增强结构用以下公式表示E(t)=O(t)-B(t), (1)其中E(t)是增强层信号,O(t)是原始图片,B(t)是时刻“t”的基层编码图片。本专利技术的新的增强结构用以下表达式说明E(t)=O(t)-sum{a(t-i)*M(B(t-i))} (2)i=L1,-L1+1,...,0,1,...,L2-1,L2其中L1和L2是“局部性,”参数,而a(t-i)则是给每个基层图片的加权参数。权值a(t-i)受到如下约束0<=a(t-i)<+1 (3)Sum{a(t-i)}=1i=-L1,-L1+1,...,0,1,...,L2-1,L2此外,选择等式(2)的加权参数a(t-i)的时候最好是使得增强层信号E(t)的尺寸最小。这一计算是在增强层剩余计算单元中进行的。但是,如果无法获得进行这一计算所需要的计算能力,那么这个权参数a(t-i)就可以在0和1之间切换,或者平均成a(t+1)=0.5或者a(t-1)=0.5。公式(2)中的M运算符表示运动估计运算,因为相邻图片或者帧内的对应部分通常都因为视频图像的运动而不在同一个位置。这样,在相邻基层图片或者帧上进行运动估计运算,为等式2中定义的增强层信号产生运动补偿(MC)信息。一般情况下,MC信息包括运动矢量和相邻图片之间的所有差别信息。根据本专利技术,计算方法有几种,为按照公式(2)产生的增强层信号使用,和发送运动补偿(MC)信息。例如,用于M运算符的运动补偿信息可以与基层计算出来的运动补偿信息(例如运动矢量)相同。但是,会出现基层没有所需运动补偿信息的情况。例如,采用后向预测的时候,如果没有作为基层的一部分计算并且发送出去(例如如果基层只包括I和P图片而不包括B图片),就必须计算并且发送后向运动补偿信息。在基层需要的以外需要计算和发送的运动信息的信息量的基础之上,有三种可能。在一种本文档来自技高网...

【技术保护点】
对视频数据进行编码的一种方法,包括以下步骤: 对一部分视频数据进行编码,产生基层帧; 对于每个剩余图像利用多个基层帧从视频数据和基层帧产生剩余图像;和 用精细颗粒可伸缩性技术对剩余图像进行编码,产生增强层帧。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A普里Y陈H拉哈
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1