当前位置: 首页 > 专利查询>索尼公司专利>正文

视频数据编码和解码制造技术

技术编号:8685954 阅读:159 留言:0更新日期:2013-05-09 05:27
本发明专利技术公开了视频数据编码和解码。一种视频数据编码装置,其中,视频数据的阵列被重排序用于熵编码,该装置包括:频域转换器,用于生成从输入视频信号得出的数据的频域表示,频域表示包含与每个图像区域有关的多个频域系数的阵列;选择器,用于从两个或更多个候选重排序图案的组中选择用于重排序频域系数的阵列的重排序图案;数据扫描器,用于根据所选重排序图案改变频域系数的顺序以生成经重排序的系数;以及熵编码器,用于对经重排序的系数进行熵编码;其中,候选重排序图案包括从包括第一重排序图案、第二重排序图案和第三重排序图案的列表中选出的至少一个重排序图案。

【技术实现步骤摘要】

本专利技术涉及视频数据编码和解码
技术介绍
存在若干种视频数据压缩和解压缩系统(作为编码和解码系统的示例),这些系统涉及将视频数据变换为频域表示,量化频域系数并且然后向量化后的系数应用某种形式的熵编码。在本上下文中,熵可被认为是对数据符号或符号序列的信息内容进行表示。熵编码的目的是利用表示数据符号序列的信息内容所需要的最少量编码数据比特(理想地)以无损方式来编码该数据符号序列。在实践中,熵编码被用来对经量化系数编码以使得经编码数据小于(在其比特数目方面)原始的经量化系数的数据大小。更高效的熵编码处理对于相同输入数据大小给出更小的输出数据大小。在视频数据压缩中使用的熵编码处理的重要部分涉及经量化系数被呈现用于编码的顺序。通常,数据扫描或重排序处理被应用于经量化系数。扫描处理的目的是对经量化的频率变换后数据进行冲排序以便将尽可能多的非零经量化经变换系数收集在一起,当然,因此,将尽可能多的零值化系数收集在一起。这些特征可允许高效地应用所谓的行程长度编码或类似技术(其通过定义了行程的长度的较少量数据比特来对零的连续序列或行程进行编码)。因此,扫描处理涉及从经量化经变换数据中选择系数,并且具体地,根据“扫描顺序”从与经变换和经量化的图像数据块相对应的系数块中选择系数,以使得(a)作为扫描的一部分,所有系数都被选择一次,并且(b)扫描倾向于提供所希望的重排序。在实践方面,频域变换级的输出通常包括一组频域系数,这些系数根据它们在原始图像块中表示的水平和垂直空间频率而变化。一般地,存在表示原始图像块中的样本的平均(DC)值的所谓的“DC”系数,以及表示低的或高的水平和垂直空间频率范围的各自排列的一连串系数。这些系数被排序以用于发送给数据扫描处理的方式当然是任意的,但是为了方便经常将系数当作数据阵列,其中DC系数在该阵列的左上角,增大的水平空间频率在该阵列中从左向右的方向上被表示出并且增大的垂直空间频率在该阵列中从上到下的方向上被表示出。在这种表示下,已发现可提供有用结果的数据扫描处理就是所谓的zigzag扫描,其以DC系数开始并且然后以zigzag方式逐个前进通过其余系数。zigzag扫描的一个示例在附图中的图16中示意性地被示出。该扫描图案意味着在DC系数之后被扫描的前两个系数是分别表示(a)和(b)的那些系数:(a)零垂直空间频率和最低水平空间频率范围;以及(b)零水平空间频率和最低垂直空间频率范围。此后,扫描继续进行以使得一次一个系数地扫描系数阵列中的连续斜线(在坐下至右上的方向上)。zigzag扫描被认为是有益的,因为对于许多常规类型的图像,并且具体地对于从真实场景捕获的图像,信息内容的大部分倾向于位于DC和低频系数中。通常是许多或所有更高频系数为零的情况。在诸如所提出的“高效率视频编码”(HEVC)系统之类的对残差图像数据(即,表示实际图像与该图像的预测版本之间的差异的数据)编码的系统中尤其是这种情况。因此,通过首先扫描DC和较低频系数,非零值可倾向于被收集在一起并且零值也可倾向于被收集在一起。如上面提到的,这可带来更高效的熵编码处理。
技术实现思路
本专利技术提供了一种将视频数据的阵列重排序用于熵编码的视频数据编码装置,该装置包括:频域转换器,用于生成从输入视频信号得出的数据的频域表示,所述频域表示包含与每个图像区域有关的多个频域系数的阵列;选择器,用于从两个或更多个候选重排序图案的组中选择用于重排序所述频域系数的阵列的重排序图案;数据扫描器,用于根据所选重排序图案改变频域系数的顺序以生成经重排序的系数;以及熵编码器,用于对所述经重排序的系数进行熵编码;其中,所述候选重排序图案包括从包括如下图案的列表中选出的至少一个重排序图案:第一重排序图案,被布置为对频域数据重排序以使得经重排序的数据包含所述频域数据的连续子集,每个子集包含表示一个维度中的恒定空间频率的数据,该一个维度随着子集而不同;第二重排序图案,被布置为对频域数据重排序以使得指示恒定水平空间频率或恒定垂直空间频率的一个或多个集合的数据分别被布置为在该频域数据的其余数据之前,所述其余频域数据根据连续子集被排序,每个子集被选择为使得水平空间频率分量和垂直空间频率分量之和对于子集内的系数来说一般是恒定的;以及第三重排序图案,被布置为根据在恒定的和增大的水平空间频率与恒定的和增大的垂直空间频率之间交替的连续子集来对所述频域数据重排序。本专利技术认识到,取决于将被压缩的图像数据的特性或压缩处理的其它方面,可以通过改变用来扫描用于熵编码的数据的扫描(重排序)图案来获得提高的效率(即,更低数目的输出数据比特)。本专利技术的其它相应方面和特征在所附权利要求中定义。附图说明现在参考附图描述本专利技术的实施例,在附图中:图1示意性地图示出了使用视频数据压缩和解压缩的音频/视频(A/V)数据发送和接收系统;图2示意性地图示出了使用视频数据解压缩的视频显示系统;图3示意性地图示出了使用视频数据压缩和解压缩的音频/视频存储系统;图4示意性地图示出了使用视频数据压缩的视频相机;图5提供了视频数据压缩和解压缩装置的示意概况;图6示意性地图示出了预测图像的生成;图7示意性地图示出了最大编码单元(LCU);图8示意性地图示出了一组的四个编码单元(⑶);图9和图10示意性地图示出了图8的编码单元被细分成更小编码单元;图11示意性地图示出了预测单元(PU)的阵列;图12示意性地图示出了变换单元(TU)的阵列;图13示意性地图示出了经部分编码的图像;图14示意性地图示出了一组可能的预测方向;图15示意性地图示出了一组预测模式;图16示意性地图示出了 zigzag扫描;图17示意性地图示出了 CABAC熵编码器;图18示意性地图示出了 CAVLC熵编码处理;图19示意性地图示出了先垂直的凹形扫描顺序;图20示意性地图示出了先水平的凹形扫描顺序;图21示意性地图示出了碎片混合zig扫描顺序;图22示意性地图示出了垂直混合zig扫描顺序;图23示意性地图示出了矩形扫描顺序;图24示意性地图示出了关于4x4个子块的模式相关扫描;图25示意性地图示出了用于检测块的末尾的扫描;图26示意性地图示出了直到块的末尾的增强扫描;图27示意性地图示出了块的末尾位于最上系数行的情况中的扫描;图28A和图28B示意性地图示出了吞吐量友好的zig扫描;图29A和图29B示意性地图示出了依据与块相关联的内部模式预测方向对扫描顺序的选择;图30示意性地图示出了定义与块相关联的扫描顺序的数据字段;图31示意性地图示出了内部模式预测方向检测器;图32示意性地图示出了运动向量检测器;图33示意性地图示出了编码器处的扫描顺序选择布置;以及图34示意性地图示出了解码器处的扫描顺序选择布置。具体实施例方式现在参考附图,图1-4被提供来给出将结合本专利技术实施例描述的利用压缩和/或解压缩装置的装置或系统的示意图示。下面将描述的所有数据压缩和/或解压缩装置可以用硬件、在诸如通用计算机之类的通用数据处理装置上运行的软件来实现,被实现为诸如专用集成电路(ASIC)或现场可编程门阵列(FPGA)之类的可编程硬件或者这些的组合。在通过软件和/或固件实现这些实施例的情况中,将理解,这样的软件和/或固件以及用于存储或以其它方式提供这样的软件和/或固件的非本文档来自技高网
...

【技术保护点】
一种视频数据编码装置,其中,视频数据的阵列被重排序用于熵编码,该装置包括:频域转换器,用于生成从输入视频信号得出的数据的频域表示,所述频域表示包含与每个图像区域有关的多个频域系数的阵列;选择器,用于从两个或更多个候选重排序图案的组中选择用于重排序所述频域系数的阵列的重排序图案;数据扫描器,用于根据所选重排序图案改变频域系数的顺序以生成经重排序的系数;以及熵编码器,用于对所述经重排序的系数进行熵编码;其中,所述候选重排序图案包括从包括如下图案的列表中选出的至少一个重排序图案:第一重排序图案,被布置为对频域数据重排序以使得经重排序的数据包含所述频域数据的连续子集,每个子集包含表示一个维度中的恒定空间频率的数据,该一个维度随着子集而不同;第二重排序图案,被布置为对频域数据重排序以使得指示恒定水平空间频率或恒定垂直空间频率的一个或多个集合的数据分别被布置为在该频域数据的其余数据之前,所述其余频域数据根据连续子集被排序,每个子集被选择为使得水平空间频率分量和垂直空间频率分量之和对于子集内的系数来说一般是恒定的;以及第三重排序图案,被布置为根据在恒定的和增大的水平空间频率与恒定的和增大的垂直空间频率之间交替的连续子集来对所述频域数据重排序。...

【技术特征摘要】
2011.11.07 GB 1119177.21.一种视频数据编码装置,其中,视频数据的阵列被重排序用于熵编码,该装置包括: 频域转换器,用于生成从输入视频信号得出的数据的频域表示,所述频域表示包含与每个图像区域有关的多个频域系数的阵列; 选择器,用于从两个或更多个候选重排序图案的组中选择用于重排序所述频域系数的阵列的重排序图案; 数据扫描器,用于根据所选重排序图案改变频域系数的顺序以生成经重排序的系数;以及 熵编码器,用于对所述经重排序的系数进行熵编码; 其中,所述候选重排序图案包括从包括如下图案的列表中选出的至少一个重排序图案: 第一重排序图案,被布置为对频域数据重排序以使得经重排序的数据包含所述频域数据的连续子集,每个子集包含表示一个维度中的恒定空间频率的数据,该一个维度随着子集而不同; 第二重排序图案,被布置为对频域数据重排序以使得指示恒定水平空间频率或恒定垂直空间频率的一个或多个集合的数据分别被布置为在该频域数据的其余数据之前,所述其余频域数据根据连续子集被排序,每个子集被选择为使得水平空间频率分量和垂直空间频率分量之和对于子集内的系数来说一般是恒定的;以及 第三重排序图案,被布置为根据在恒定的和增大的水平空间频率与恒定的和增大的垂直空间频率之间交替的连续子集来对所述频域数据重排序。2.根据权利要求1所述的装置,包括量化器,用于在频域系数被所述数据扫描器重排序之前对所述系数进行量化。3.根据权利要求2所述的装置,包括映射图生成器,用于生成二进制数据,所述二进制数据指示特定的相应值或特定的相应范围的值的系数在所述频域系数的阵列中的位置。4.根据前面权利要求中任一项所述的装置,包括: 图像预测器,用于生成输入视频信号的当前图像的预测版本;以及 组合器,用于将所述当前图像与该图像的预测版本相组合以生成残差图像; 所述频域转换器被配置为生成所述残差图像的频域表示。5.根据权利要求4所述的装置,其中,所述选择器被配置为依据所述图像预测器在生成所述当前图像的预测版本时使用的一个或多个参数来选择重排序图案。6.根据权利要求5所述的装置,其中,所述一个或多个参数包括表示与图像内预测有关的预测方向的图像方向。7.根据权利要求5所述的装置,其中,所述一个或多个参数包括表示运动方向的图像方向,所述运动方向指示在所述当前图像与另外图像之间检测到的图像运动。8.根据权利要求6或7所述的装置,其中,所述选择器被配置为:关于至少具有占主导的垂直图像方向的图像区域,选择用于使得指示恒定水平空间频率的数据被布置在该频域数据的所有其他数据之前的所述第二重排序图案,并且关于至少具有占主导的水平图像方向的图像区域,选择用于使得指示恒定垂直空间频率的数据被布置在该频域数据的所有其他数据之前的所述第二重排序图案。9.根据权利要求6或7所述的装置,其中,所述选择器被配置为关于至少具有占主导的水平图像方向或占主导的垂直图像方向的图像区域,选择所述第一重排序图案。10.根据权利要求9所述的装置,其中,所述第一重排序图案被应用来使得所述子集中的第一子集在与占主导的图像方向相对应的维度中具有恒定空间频率。11.根据权利要求6至10中任一项所述的装置,其中,所述选择器被配置为对于具有占主导的斜线图像方向的图像区域,选择所述第三重排序图案。12.根据权利要求1至5中任一项所述的装置,其中,所述选择器被配置为利用不同的相应候选重排序图案来执行一次或多次试验熵编码,并且选择所述试验编码指示将给出最低输出数据量的重排序图案。13.根据前面权利要求中任一项所述的装置,包括数据标志生成器,用于生成与经编码的输出视频信号相关联的、指示所述选择器选择了哪个重排序图案的数据。14.一种视频数据解压缩装置,包括: 熵解码器,用于对输入的经编码视频信号进行熵解码以生成重排序的频域数据; 选择器,用于从两个或更多个候选重排序图案的组中选择用于排序所述经重排序的频域数据的重排序图案; 数据扫描器,用于根据所选重排序图案改变经重排序的频域系数的顺序以生成经排序的频域数据; 频域转...

【专利技术属性】
技术研发人员:詹姆斯·亚历山大·戈梅尼古拉斯·里安·桑德斯卡尔·詹姆斯·沙曼保罗·詹姆斯·西尔考克
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1