支持针对片数据的多通路视频语法结构的方法和设备技术

技术编号:4584680 阅读:206 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了支持针对片数据的多通路视频结构的方法和设备。设备包括编码器(300),所述编码器(300)用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码。所述至少一个语法元素被编码在多通路语法结构内。所述至少一个语法元素属于给定的数据类。编码器(300)在对下个数据类进行编码之前对关于所述图像的至少所述部分中的所有分块的所述至少一个语法数据元素进行编码,其中,包括所述下个类在内的在后编码数据类具有关于比所述下个类更早编码的在先编码数据类的因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及视频编码和解码,更具体地,涉及支持针对片数据的多通路视频语法结构的方法和设备
技术介绍
在一些编码策略中,帧分块(例如,宏块、子块和/或块)中的语法元素的编码取决于或依赖于对来自整个邻域(根据编码扫描顺序是因果或非因果的)的语法元素分配的数据。典型的宏块数据编码,例如在国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)的第10部分高级视频编码(AVC)标准/国际电信联盟电信部(ITU-T)H.264推荐标准(此后称之为“MPEG-4 AVC标准”)中执行的宏块数据编码,削弱了这种编码策略的使用,这是由于在扫描顺序中来自后续宏块的数据是不可用的。 MPEG-4 AVC标准提出了被分块成三种类别的片数据,其中,数据被基本划分如下类别A是除了残差以外的所有数据;类别B是残差数据的部分一;以及类别C是残差数据的部分二。数据分块的目的是差错复原。在解码器处,可以将三种类别的语法合并成一个完整情况并基于扫描顺序执行一通路分析。MPEG-4 AVC标准不允许关于整个宏块和/或块邻域的模式数据对运动数据进行条件和/或相依编码。此外,MPEG-4 AVC标准不允许在模式数据和运动数据内插入其他语法数据类。 根据第一现有技术方法的实际应用(例如,叶合并)仅集中于算法,并且不支持用于对数据进行适当系统编码的有序方案。 叶合并范例依赖于以下事实在图像编码领域,近来已发现用于表示几何图像特征的四叉树不能够获得最优的指数衰减速率失真行为。通过在速率失真(R-D)最优树修剪之后进行叶合并步骤可以纠正该问题。考虑到同样的问题,第一种现有技术方法注意到基于四叉树对视频压缩的运动表示具有同样的基本缺陷,该基本缺陷同样可以通过叶合并来克服。基于这些观察,第一种现有技术方法提出对MPEG-4 AVC标准所使用的现有模型的非迭代扩展,其中,在第一树分解之后,自适应地合并相邻的块以进行联合编码。这在对预测进行编码的块、这些块的编码模式和合并辅助信息之间产生了一系列因果和非因果相依性。为此,有必要关于扫描顺序以非因果方式来访问一些数据类。然而,第一种现有技术方法并没有提供一种系统且有序的方式来对必要数据类进行编码以将叶合并到编码流中。实际上,对于每个块,对合并假设进行测试。如果压缩效率通过与相邻块进行合并而提高,则使能合并以将该块与所选目标块合并。对于给定块的可能合并目标取决于相邻块模式,并取决于合并候选块的特定模式。因此,合并辅助信息取决于所有相邻块模式和合并候选块的特定模式。最终,预测编码将取决于块的合并辅助信息,其同时取决于相邻块的合并辅助信息以及本地和相邻编码模式。 转向图1,一般由参考数字100指示能够根据MPEG-4 AVC标准执行视频编码的视频编码器。 视频编码器100包括帧排序缓冲器110,帧排序缓冲器110具有与组合器185的非反相输入进行信号通信的输出。组合器185的输出以信号通信的方式与变换器和量化器125的第一输入相连接。变换器和量化器125的输出以信号通信的方式与熵编码器145的第一输入和逆变换器和逆量化器150的第一输入相连接。熵编码器145的输出以信号通信的方式与组合器190的第一非反相输入相连接。组合器190的输出以信号通信的方式与输出缓冲器135的第一输入相连接。 编码器控制器105的第一输出以信号通信的方式与帧排序缓冲器110的第二输入、逆变换器和逆量化器150的第二输入、图像类型判决模块115的输入、宏块类型(MB类型)判决模块120的输入、帧内预测模块160的第二输入、解块滤波器165的第二输入、运动补偿器170的第一输入、运动估计器175的第一输入、以及参考图像缓冲器180的第二输入相连接。 编码器控制器105的第二输出以信号通信的方式与补充增强信息(SEI)插入器130的第一输入、变换器和量化器125的第二输入、熵编码器145的第二输入、输出缓冲器135的第二输入、以及序列参数集(SPS)和图像参数集(PPS)插入器140的输入相连接。 图像类型判决模块115的第一输出以信号通信的方式与帧排序缓冲器110的第三输入相连接。图像类型判决模块115的第二输出以信号通信的方式与宏块类型判决模块120的第二输入相连接。 序列参数集(SPS)和图像参数集(PPS)插入器140的输出以信号通信的方式与组合器190的第三非反相输入相连接。 逆量化器和逆变换器150的输出以信号通信的方式与组合器127的第一非反相输入相连接。组合器127的输出以信号通信的方式与帧内预测模块160的第一输入和解块滤波器165的第一输入相连接。解块滤波器165的输出以信号通信的方式与参考图像缓冲器180的第一输入相连接。参考图像缓冲器180的输出以信号通信的方式与运动估计器175的第二输入相连接。运动估计器175的第一输出以信号通信的方式与运动补偿器170的第二输入相连接。运动估计器175的第二输出以信号通信的方式与熵编码器145的第三输入相连接。 运动补偿器170的输出以信号通信的方式与开关197的第一输入相连接。帧内预测模块160的输出以信号通信的方式与开关197的第二输入相连接。宏块类型判决模块120的输出以信号通信的方式与开关197的第三输入相连接。开关197的输出以信号通信的方式与组合器127的第二非反相输入相连接。 帧排序缓冲器110和编码器控制器105的输入可用作编码器100的输入,以用于接收输入图像101。此外,补充增强信息(SEI)插入器130的输入可用作编码器100的输入,以用于接收元数据。输出缓冲器135的输出可用作编码器100的输出,以用于输出比特流。 转向图2,一般由参考数字200指示能够根据MPEG-4 AVC标准执行视频解码的视频解码器。 视频解码器200包括输入缓冲器210,该输入缓冲器210具有与熵解码器245的第一输入以信号通信的方式相连接的输出。熵解码器245的第一输出以信号通信的方式与逆变换器和逆量化器250的第一输入相连接。逆变换器和逆量化器250的输出以信号通信的方式与组合器225的第二非反相输入相连接。组合器225的输出以信号通信的方式与解块滤波器265的第二输入和帧内预测模块260的第一输入相连接。解块滤波器265的第二输出以信号通信的方式与参考图像缓冲器280的第一输入相连接。参考图像缓冲器280的输出以信号通信的方式与运动补偿器270的第二输入相连接。 熵解码器245的第二输出以信号通信的方式与运动补偿器270的第三输入和解块滤波器265的第一输入相连接。熵解码器245的第三输出以信号通信的方式与解码器控制器205的输入相连接。解码器控制器205的第一输出以信号通信的方式与熵解码器245的第二输入相连接。解码器控制器205的第二输出以信号通信的方式与逆变换器和逆量化器250的第二输入相连接。解码器控制器205的第三输出以信号通信的方式与解块滤波器265的第三输入相连接。解码器控制器205的第四输出以信号通信的方式与帧内预测模块260的第二输入、运动补偿器270的第一输入、以及参考图像缓冲器280的第二输入相连接。 运动补偿器270的输出以信号通信的方式与开关297的第一输入相连接。帧内预测模块260的输出以信号本文档来自技高网...

【技术保护点】
一种设备,包括: 编码器(300),用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码,其中,所述至少一个语法元素被编码在多通路语法结构内,所述至少一个语法元素属于给定的数据类,并且所述编码器在对下个数据类进行编 码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码,其中,关于比所述下个类更早编码的在先编码数据类,包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。

【技术特征摘要】
【国外来华专利技术】US 2007-6-12 60/943,4061、一种设备,包括编码器(300),用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码,其中,所述至少一个语法元素被编码在多通路语法结构内,所述至少一个语法元素属于给定的数据类,并且所述编码器在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码,其中,关于比所述下个类更早编码的在先编码数据类,包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。2、根据权利要求1所述的设备,其中,编码器(300)是现有视频编码标准或视频编码推荐标准的现有编码器的扩展版本。3、根据权利要求1所述的设备,其中,多通路语法结构用于片语法编码。4、根据权利要求1所述的设备,其中,使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。5、根据权利要求1所述的设备,其中,针对所述至少两个分块的模式数据和预测数据与不同的数据类有关。6、根据权利要求1所述的设备,其中,所述数据包括模式数据和运动数据,并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。7、一种方法,包括对于与图像的至少一部分的至少两个分块相关的至少一个语法数据元素进行编码,其中,所述至少一个语法元素被编码在多通路语法结构内,所述至少一个语法元素属于给定的数据类,并且所述编码步骤在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码,其中,关于比所述下个类更早编码的在先编码数据类,包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个(515、530、545)。8、根据权利要求7所述的方法,其中,所述方法由编码器来执行,所述编码器是现有视频编码标准或视频编码推荐标准的现有编码器的扩展版本。9、根据权利要求7所述的方法,其中,多通路语法结构用于片语法编码(510、520、525、535、540、550)。10、根据权利要求7所述的方法,其中,使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。11、根据权利要求7所述的方法,其中,针对所述至少两个分块的模式数据和预测数据与不同的数据类有关(515、545)。12、根据权利要求7所述的方法,其中,所述数据包括模式数据和运动数据,并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。13、一种设备,包括解码器(400),用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行解码,其中,所述至少一个语法元素是从多通路语法结构中被解码的,所述至少一个语法...

【专利技术属性】
技术研发人员:奥斯卡迪沃拉埃斯科达尹鹏普尔温比贝哈斯潘迪特
申请(专利权)人:汤姆森许可贸易公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1