当前位置: 首页 > 专利查询>斯凯普公司专利>正文

用于视频的数据压缩制造技术

技术编号:7999427 阅读:162 留言:0更新日期:2012-11-23 12:21
一种压缩视频信号的方法。该方法包括:对于多个图像部分的每一个,将空间域表示变换成变换域表示;以及,对于多个要被编码的目标图像部分的每一个,确定相应的参考部分,基于参考部分确定目标图像部分的预测,以及基于该预测编码目标图像部分。该预测包括基于目标图像部分的变换域系数的处理预测该目标图像部分相对于参考部分的非横向运动。该编码包括生成包括关于非横向运动的信息的编码的比特流,以供解码器使用。

【技术实现步骤摘要】
【国外来华专利技术】用于视频的数据压缩
本专利技术涉及视频流的编码和传输。
技术介绍
在视频流的传输中,正不断地努力来减少需要被传输的数据的量,同时仍然允许移动的图像在传输的接收端处适当地被重新创建。视频编码器接收包括要被编码的“原始”视频帧序列的输入视频流,每个视频帧表示在相应时刻的图像。该编码器然后将每个输入帧编码成两种类型编码的帧之一:内帧(intraframe)(也被称为关键帧)或间帧(interframe)。编码的目的是压缩视频数据,以便当视频数据通过传输介质传输或存储在存储介质上时招致(incur)更少的比特。使用仅来自正被编码的当前视频帧的数据、典型地使用帧内预测编码(coding)来压缩内帧,由此该帧内的一个图像部分相对于同一帧内的另一个图像部分被编码并被发信号传递(signal)。这类似于静态图像编码。另一方面,使用先前帧(参考帧)的知识来压缩间帧,并且该间帧仅允许参考帧与在时间上紧随它的当前帧之间的差的传输。这允许高效得多的压缩,特别是当场景具有相对较少的变化时。帧间预测典型地使用运动估计依据(intermsof)描述帧之间的图像部分的移动的运动向量来编码并发信号传递该视频,并且然后使用运动补偿来基于用信号传递的向量在接收器处预测该运动。用于视频通信的各种国际标准,比如MPEG1、2&4和H.261、H.263&H.264,采用基于在规则的块的基础上的源帧的划分的运动估计和补偿。根据分辨率、帧速率、比特率和场景,内帧可以达到间帧的20到100倍大。另一方面,间帧将依赖关系施加到高达最近的内帧的先前的间帧。如果任意一个帧遗漏,则解码当前间帧可能导致错误和伪影。这些技术例如被用在H.264/AVC标准中(参见T.Wiegand,G.J.Sullivan,G.Bjontegaard,A.Luthra:“OverviewoftheH.264/AVCvideocodingstandard,”inIEEETransactionsonCircuitsandSystemsforVideoTechnology,Volume:13,Issue:7,page(s):560-576,July2003)。图7图示用于例如根据H.264/AVC的基本编码结构将视频流编码成间帧和交错的内帧的流的已知的视频编码器。编码器接收包括要被编码的帧序列的输入视频流(每个帧被分成组成宏块并被细分成块),并且输出然后可以被传输到解码器的量化的变换系数和运动数据。该编码器包括用于接收视频图像的输入宏块的输入端70、减法级(stage)72、正变换级74、正量化级76、逆量化级78、逆变换级80、帧内预测编码级82、运动估计&补偿级84和熵编码器86。减法级72被设置成接收包括一系列输入宏块的输入信号,每个输入宏块对应于帧的一部分。减法级72从每一个宏块减去该宏块的预测,以便生成残差(residual)信号(有时也被称为预测误差)。在帧内预测的情况下,从帧内预测级82基于相同帧的一个或多个相邻区域提供块的预测(在经由逆量化级78和逆变换级80反馈之后)。在帧间预测的情况下,从运动估计&补偿级84基于先前帧的所选区域提供块的预测(再次在经由逆量化级78和逆变换级80反馈之后)。对于运动估计,借助描述先前帧中的所选区域的位置与在当前帧中正被编码的宏块之间的偏移的运动向量来识别所选区域。然后,正变换级74例如借助离散余弦变换(DCT)将块的残差从空间域表示变换为变换域表示。也就是说,它将每个残差块从在不同的笛卡尔x和y坐标处的一组像素值变换为表示具有不同波数kx和ky(具有1/波长的大小)的不同的空间频率项的一组系数。然后,正量化级76量化变换系数,并且输出要经由熵编码器86被编码成视频流的残差信号的量化且变换的系数,从而形成用于传输到一个或多个接受者终端的编码的视频信号的一部分。而且,正量化级76的输出也经由逆量化级78和逆变换级80反馈。逆变换级80将残差系数从频域变换回空间域值,其中它们被提供给帧内预测级82(用于内帧)或运动估计&补偿级84(用于间帧)。这些级使用逆变换的和逆量化的残差信号连同输入视频流的知识,以便产生内帧和间帧的局部预测(包括如在解码器处看到的已被正和逆变换和量化的扭曲效应)。该局部预测被反馈到减法级72,其产生表示输入信号与局部帧内预测级82或局部运动估计&补偿级84的输出之间的差的残差信号。在变换之后,正量化级76量化该残差信号,从而生成量化的、变换的残差系数以用于输出到熵编码器86。运动估计级84还经由熵编码器86输出运动向量以包括在编码的比特流中。当执行帧内编码时,思想是仅编码并传输关于帧内的图像数据部分多么不同于同一帧内的另一个部分的测量(measure)。该部分然后可以在解码器处预测(给定一些用于开始的绝对数据),并且因此,仅需要传输预测数据与实际数据之间的差而非实际数据自身。该差信号典型地在量级方面更小,所以采用更少的比特来编码。在帧间编码的情况下,代替帧内预测级82,运动补偿级84被切换到反馈路径中,并且反馈回路因此被创建在一个帧与另一个帧的块之间,以便相对于先前帧的块来编码该间帧。与内帧相比,这典型地采用甚至更少比特来编码。图8图示了相应的解码器,其包括用于接收进入接受者终端的编码的视频流的熵解码器90、逆量化级92、逆变换级94、帧内预测级96和运动补偿级98。帧内预测级和运动补偿级的输出在求和级100处被求和。存在许多已知的运动估计技术。一般地,它们依靠对块与来自先前帧(参考帧)的一个或多个其他图像部分的比较。从与块相同尺寸和形状的、但在水平和竖直方向上偏移任意数量的像素或者甚至分数数量的像素的区域预测每个块。所使用的区域的身份以运动向量的形式作为开销(“边信息”)被发信号传递。良好的运动估计技术必须平衡低复杂度与高质量视频图像的需求。还期望它不需要太多开销信息。在上文所述的标准系统中,应当注意,帧内预测编码和帧间预测编码(运动估计)在非量化的空间域中被执行。最近,在变换域中操作的运动估计技术已经引起注意。然而,现有技术都不能够以低复杂度执行(从而减少计算开销),同时还实现(deliver)高质量。因此,当前实践中,对于运动估计不使用频域技术。VC-1视频编码解码器具有在频域中操作的帧内预测模式,其中DCT(离散傅立叶变换)域中AC系数的第一列和/或第一行是根据紧接地位于处理的块左边或上面的DCT块的第一列(或第一行)预测的。也就是说,位于一个块边缘的系数是根据邻近块中直接空间邻居预测的。为了参考,参见“TheVC-1andH.264VideoCompressionStandardsforBroadbandVideoServices”,AvHariKalva,Jae-BeomLee,pp.251。
技术实现思路
根据本专利技术的一个方面,提供一种压缩视频信号的方法,该视频信号包括多个视频帧,其中每个帧被分成多个图像部分,该方法包括:对于多个图像部分的每一个,将该图像部分从空间域表示变换成变换域表示,以便生成相应的变换域系数组;以及,对于要被编码的所述图像部分的多个目标图像部分的每一个,确定由相应的变换域系数组表示的相应的参考部分,基于参考部分确定目标图像部分本文档来自技高网
...
用于视频的数据压缩

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.02.19 US 61/306,399;2010.07.16 US 12/838,1971.一种用于视频数据编码的方法,包括:将视频信号的帧的多个图像部分的各个图像部分从空间域表示变换成变换域表示,以便针对各个图像部分的每一个生成相应的变换域系数组;针对多个图像部分的至少一个,确定由相应的变换域系数组表示的相应的参考部分,该相应的变换域系数组被安排以第一顺序;针对所述多个图像部分的所述至少一个,通过预测目标图像部分相对于所述相应的参考部分的非横向运动,来基于所述参考部分确定所述目标图像部分的预测,所述预测基于:变换域系数的由所述非横向运动导致的从所述相应的参考部分的第一顺序到针对所述目标图像部分的类似的变换域系数中表达的第二顺序的重排序;和以所述相应参考部分的所述变换域系数的第一顺序表达的模式和以针对所述目标图像部分的类似变换域系数的第二顺序表达的模式之间的相似性;以及通过生成包括有关所述非横向运动的信息的编码的比特流来基于所述预测对所述目标图像部分编码。2.如权利要求1的方法,其中所述相应的参考部分的确定包括选择从每个均由相应的变换域系数组表示的多个潜在的参考部分中选定的参考部分,并且目标图像部分的预测基于所选的参考部分。3.如权利要求2的方法,其中所述多个潜在的参考部分包括至少一个用于根据一种类型的运动预测来预测所述目标图像部分的横向运动的潜在参考部分,和至少一个用于根据另一种类型的运动预测来预测目标图像部分的非横向运动的潜在参考部分;以及所述信息指示要被解码器用来解码所述目标图像部分的运动预测的类型。4.如权利要求3的方法,其中所述多个潜在的参考部分包括至少一个用于根据第一类型的运动预测来预测目标图像部分的横向运动的潜在参考部分、至少一个用于根据第二类型的运动预测来预测目标图像部分的缩放的潜在参考部分、以及至少一个用于根据第三类型的运动预测来预测目标图像部分的旋转的潜在参考部分;以及所述信息指示第一、第二或第三类型的运动预测是否将被解码器用来解码目标图像部分。5.如权利要求2的方法,进一步包括基于相应的变换域系数确定用于目标图像部分和多个参考部分的每一个的相应索引值;其中对所选的参考部分的选择基于索引值。6.如权利要求5的方法,其中对所选参考部分的选择包括选择具有在目标图像部分的预定范围内的索引值的候选部分的子集,并且从候选部分中选择相应的参考部分。7.如权利要求5的方法,其中所述索引值表示相应部分的能量。8.如权利要求7的方法,其中所述索引值基于下述之一:相应部分中非零变换域系数的数量,以及相应部分中具有零值的变换域系数的数量。9.如权利要求7的方法,其中所述索引值基于相应部分的变换域系数的聚合组合。10.如权利要求9的方法,其中所述索引值基于相应部分中变换域系数的模量的平均值或总和。11.如权利要求2的方法,其中对所选参考部分的选择基于在编码的比特流中编码目标图像部分所需的比特数的确定。12.如权利要求11的方法,其中对从候选部分中选定的参考部分的选择基于在编码的比特流中相对于候选部分的每一个编码目标图像部分所需的比特数的确定。13.如权利要求2的方法,包括:在对视频信号...

【专利技术属性】
技术研发人员:L比沃拉斯基M尼尔松R瓦芬SV安德森
申请(专利权)人:斯凯普公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1