一种压缩视频数据的方法,该方法包括:提供用于多个图像部分的每一个的图像数据;基于相应图像数据确定用于所述图像部分的每一个的索引值;对于要被编码的目标图像部分,识别具有在目标图像部分索引值的搜索阈值内的索引值的匹配图像部分;以及生成用于目标图像部分相对于匹配图像部分的差异数据,并且将该差异数据包括在编码的视频信号中。
【技术实现步骤摘要】
【国外来华专利技术】用于视频的数据压缩
本专利技术涉及视频流的编码和传输。
技术介绍
在视频流的传输中,正不断地努力来减少需要被传输的数据的量,同时仍然允许移动的图像在传输的接收端处适当地被重新创建。视频编码器接收包括要被编码的“原始”视频帧序列的输入视频流,每个视频帧表示在各自时刻的图像。该编码器随后将每个输入帧编码成两种类型编码的帧之一:内帧(intraframe)(也被称为关键帧)或间帧(interframe)。编码的目的是压缩视频数据,以便当视频数据通过传输介质传输或存储在存储介质上时产生更少的比特。使用仅来自正被编码的当前视频帧的数据来压缩内帧,典型地使用帧内预测编码,从而该帧内的一个图像部分相对于同一帧内的另一个图像部分被编码并被信令发送(signal)。这类似于静态图像编码。另一方面,使用先前帧(参考帧)的知识来压缩间帧,并且该间帧允许仅传输参考帧与在时间上跟随它的当前帧之间的差别。这允许更加高效的压缩,特别是当场景具有相对较少的变化时。帧间预测典型地使用运动估计依据(intermsof)描述帧之间的图像部分的移动的运动向量来编码并发信号传输该视频,并且随后使用运动补偿来基于用信号传输的向量在接收器处预测该运动。用于视频通信的各种国际标准,比如MPEG1、2&4和H.261、H.263&H.264,采用基于在规则的块的基础上的源帧的划分的运动估计和补偿。根据分辨率、帧速率、比特率和场景,内帧可以达到间帧的20到100倍大。另一方面,间帧将依赖关系施加到先前的间帧,一直到最近的内帧。如果任意一个帧遗漏,则解码当前间帧可能导致错误和伪影。这些技术例如被用在H.264/AVC标准中(参见T.Wigand,G.J.Sullivan,G.Bjontegaard,A.Luthra:“OverviewoftheH.264/AVCvideocodingstandard,”inIEEETransactionsonCircuitsandSystemsforVideoTechnology,Volume:13,Issue:7,page(s):560-576,July2003)。图7图示用于例如根据H.264/AVC的基本编码结构将视频流编码成间帧和交错的内帧的流的已知的视频编码器。编码器接收包括要被编码的帧序列的输入视频流(每个帧被分成组成宏块并被细分成块),并且输出随后可以被传输到解码器的量化的变换系数和运动数据。该编码器包括用于接收视频图像的输入宏块的输入端70、减法级(stage)72、正变换级74、正量化级76、逆量化级78、逆变换级80、帧内预测编码级82、运动估计&补偿级84、和熵编码器86。减法级72被设置成接收包括一系列输入宏块的输入信号,每个输入宏块对应于帧的一部分。减法级72从每一个宏块减去该宏块的预测,以便生成残差(residual)信号(有时也被称为预测误差)。在帧内预测的情况下,基于相同帧的一个或多个相邻区域从帧内预测级82提供块的预测(在经由逆量化级78和逆变换级80反馈之后)。在帧间预测的情况下,基于先前帧的所选区域从运动估计&补偿级84提供块的预测(再次在经由逆量化级78和逆变换级80反馈之后)。对于运动估计,借助描述先前帧中的所选区域的位置与在当前帧中正被编码的宏块之间的偏移的运动向量来识别所选区域。随后,正变换级74例如借助离散余弦变换(DCT)将块的残差从空间域表示变换为变换域表示。也就是说,它将每个残差块从在不同的笛卡尔x和y坐标处的一组像素值变换为表示具有不同波数kx和ky(具有1/波长的大小)的不同的空间频率项的一组系数。随后,正量化级76量化变换系数,并且输出要经由熵编码器86被编码成视频流的残差信号的量化且变换的系数,从而形成用于传输到一个或多个接收者终端的编码的视频信号的一部分。而且,正量化级76的输出也经由逆量化级78和逆变换级80反馈。逆变换级80将残差系数从频域变换回空间域值,其中它们被提供给帧内预测级82(用于内帧)或运动估计&补偿级84(用于间帧)。这些级使用逆变换的和逆量化的残差信号连同输入视频流的知识,以便产生帧内和帧间的局部预测(包括如在解码器处看到的已被正和逆变换和量化的扭曲效应)。该局部预测被反馈到减法级72,其产生表示输入信号与局部帧内预测级82或运动估计&补偿级84的输出之间的差的残差信号。在变换之后,正量化级76量化该残差信号,从而生成量化的、变换的残差系数以用于输出到熵编码器86。运动估计级84还经由熵编码器86输出运动向量以包括在编码的比特流中。当执行帧内编码时,思想是仅编码并传输关于帧内的图像数据部分如何不同于同一帧内的另一个部分的度量。该部分随后可以在解码器处预测(给定一些用于开始的绝对数据),并且因此,仅需要传输预测数据与实际数据之间的差而非实际数据自身。该差信号典型地在量级方面更小,所以采用更少的比特来编码。在帧间编码的情况下,代替帧内预测级82,运动补偿级84被切换到反馈路径中,并且反馈回路因此被创建在一个帧与另一个帧的块之间,以便相对于先前帧的块来编码该间帧。与内帧相比,这典型地采用甚至更少比特来编码。图8图示了相应的解码器,其包括用于接收进入接收者终端的编码的视频流的熵解码器90、逆量化级92、逆变换级94、帧内预测级96和运动补偿级98。帧内预测级和运动补偿级的输出在求和级100处被求和。存在许多已知的运动估计技术。一般地,它们依靠对块与来自先前帧(参考帧)的一个或多个其他图像部分的比较。从与块相同大小和形状的、但在水平和竖直方向上偏移任意数量的像素或者甚至分数数量的像素的区域预测每个块。所使用的区域的身份被以运动向量的形式作为开销(“辅助信息”)而被用信号传输。良好的运动估计技术必须平衡低复杂度与高质量视频图像的需求。还期望它不需要太多开销信息。在上文所述的标准系统中,应当注意,帧内预测编码和帧间预测编码(运动估计)在未量化的空间域中被执行。最近,在变换域中操作的运动估计技术已经引起注意。然而,现有技术都不能够在以低复杂度执行(从而减少计算开销)的同时还输送(deliver)高质量。因此,当前实践中,对于运动估计不使用频域技术。VC-1视频编码解码器具有在频域中操作的帧内预测模式,其中DCT(离散傅立叶变换)域中AC系数的第一列和/或第一行是从直接地位于处理的块左边或上面的DCT块的第一列(或第一行)预测的。也就是说,位于一个块边缘的系数是从邻近块中的直接空间邻居预测的。为了参考,参见“TheVC-1andH.264VideoCompressionStandardsforBroadbandVideoServices”,AvHariKalva,Jae-BeomLee,pp.251。
技术实现思路
根据本专利技术的一个方面,提供一种压缩视频数据的方法,该方法包括:提供用于多个图像部分的每一个的图像数据;基于相应图像数据确定用于所述图像部分的每一个的索引值;对于要被编码的目标图像部分,识别其索引值在目标图像部分的索引值的搜索阈值内的匹配图像部分;以及生成目标图像部分相对于匹配图像部分的差异数据,并且将该差异数据包括在编码的视频信号中。匹配图像部分的识别可以包括从多个候选图像部分之中识别其索引本文档来自技高网...

【技术保护点】
【技术特征摘要】
【国外来华专利技术】2010.02.19 US 61/306,410;2010.07.16 US 12/838,1311.一种压缩视频数据的方法,该方法包括:提供用于多个图像部分的每一个的图像数据;基于相应图像数据确定用于每一个所述图像部分的索引值,其中所述索引值是相应图像部分的变换域系数的聚集组合,相应图像部分的变换域系数的聚集组合包括以下内容之一:在所述图像部分的每一个中的零或非零系数的数量,或相应图像部分中的系数的模的平均或总值;对于要被编码的目标图像部分,识别具有在目标图像部分的索引值的搜索阈值内的索引值的匹配图像部分;以及生成目标图像部分相对于匹配图像部分的差异数据,并且将该差异数据包括在编码的视频信号中。2.根据权利要求1的方法,其中匹配图像部分的识别包括从多个均具有在目标图像部分的索引值的搜索阈值内的索引值的候选图像部分之中识别匹配图像部分。3.根据权利要求1的方法,其中匹配图像部分的识别包括:基于索引值将所述图像部分的列表排序,以便生成排序的列表;以及选择与目标的接近程度在排序的列表中的搜索阈值内的匹配图像部分。4.根据权利要求3的方法,其中匹配图像部分的识别包括确定候选图像部分的组,其中每一个候选图像部分与该目标的接近程度在排序列表中的搜索阈值内,以及从这些候选中选择最佳的匹配图像部分。5.根据权利要求1的方法,其中图像数据的提供包括将所述图像部分的每一个从空间和/或时间域表示变换为变换域表示,从而生成用于每个图像部分的变换域系数的相应组;以及所述索引值的确定包括基于相应变换域系数确定用于图像部分之中的每一个的索引...
【专利技术属性】
技术研发人员:L比沃拉斯基,R瓦芬,M尼尔松,SV安德森,
申请(专利权)人:斯凯普公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。