用于非基带信号代码化的变换选择制造技术

技术编号:27009949 阅读:12 留言:0更新日期:2021-01-08 17:18
公开了用于非基带信号代码化的变换选择。通过在基于阶梯或正弦的变换之间进行选择而对非基带视频信号的帧的块进行编码。针对每个预测模式,生成用于对当前块进行编码的预测块,生成残差块,使用基于正弦的变换以及使用基于阶梯的变换变换所述残差块,以及相应地生成用于使用所述基于正弦的变换和基于阶梯的变换对所述残差块进行编码的第一和第二率失真值。基于每个预测模式的结果中的第一率失真值和第二率失真值的最小值选择用于对所述残差块进行编码的变换,并且使用所选择的变换对当前块进行编码。能够实现用于具有锐利边缘的块的改进的装置,并且可能使用基于阶梯的变换进行无损编码。

【技术实现步骤摘要】
用于非基带信号代码化的变换选择本申请是分案申请,原案的申请号是201680024162.6,申请日是2016年6月29日,专利技术名称是“用于非基带信号代码化的变换选择”。
本申请涉及用于非基带信号代码化的变换选择。
技术介绍
数字视频流通常使用帧或静态图像的序列来表示视频。每个帧可以包括多个块,所述块进而可以包含描述像素的颜色、亮度或其它属性的值的信息。典型视频流中的数据量很大,并且视频的传送和存储会使用相当的计算或通信资源。已经提出了各种方法来减少视频流中的数据量,包括压缩和其它编码技术。这样的技术经常向重构的视频信号中引入伪像(artifact)。
技术实现思路
本公开总体上涉及对诸如视频流数据的视觉数据进行编码和解码,以便使用针对非基带信号代码化的变换选择进行传送或存储。与其中像素值在绝大多数情况下平滑变化的自然视频信号相反,非基带信号在视频图像中包括相对大量的锐利边缘和阶梯变化。本文所教导的一种方法描述了:接收视频信号,所述视频信号包括具有多个帧的非基带信号,每个帧由多个块形成,并且每个块具有多个像素。针对多个预测模式中的每个预测模式,所述方法包括:使用所述预测模式生成用于对当前块进行编码的预测块,基于所述预测块和当前块生成残差块,使用基于正弦的变换对所述残差块进行变换,生成第一率失真值用于使用所述基于正弦的变换对所述残差块进行编码,使用基于阶梯的变换对所述残差块进行变换,并且生成第二率失真值用于使用所述基于阶梯的变换对所述残差块进行编码。所述方法还包括基于每个预测模式的结果中的所述第一率失真值和第二率失真值中的最低值选择基于阶梯的变换或基于正弦的变换中的一个变换用于对所述残差块进行编码,并且使用基于阶梯的变换或基于正弦的变换中的该一个变换对当前块进行编码。本文所描述的装置包括存储器和处理器。根据一个实施方式,所述处理器被配置成执行存储在所述存储器中的指令以接收视频信号,所述视频信号的每个帧包括具有多个帧的非基带信号,每个帧由多个块形成,并且每个块具有多个像素,以及针对多个预测模式中的每个预测模式,使用所述预测模式生成用于对当前块进行编码的预测块,基于所述预测块和当前块生成残差块,使用基于正弦的变换对所述残差块进行变换,生成第一率失真值用于使用所述基于正弦的变换对所述残差块进行编码,使用基于阶梯的变换对所述残差块进行变换,并且生成第二率失真值用于使用所述基于阶梯的变换对所述残差块进行编码。所述处理器进一步被配置成执行存储在所述存储器中的指令以基于每个预测模式的结果中所述第一率失真值和第二率失真值中的最低值选择基于阶梯的变换或基于正弦的变换中的一个变换用于对所述残差块进行编码,并且使用基于阶梯的变换或基于正弦的变换中的一个变换对当前块进行编码。本公开中的这些和其它方面的变体将在下文更详细地进行描述。附图说明本文的描述参考附图,其中相似的附图标记贯穿多个视图指代相似的部分,并且其中:图1是视频编码和解码系统的示意图;图2是能够实施发送站和接收站的计算设备的示例的框图;图3是所要被编码并在后续被解码的典型视频流的示图;图4是根据本文教导的方面的视频压缩系统的框图;图5是根据本文教导的另一个方面的视频解压缩系统的框图;以及图6是用于对非基带信号进行编码的处理的流程图,所述处理包括在基于正弦的变换和基于阶梯的变换之间选择变换类型。具体实施方式视频流可以通过各种技术而被压缩从而减少发送或存储所述视频流所需的带宽。视频流能够被编码为比特流,这可以包含压缩,并且随后被发送至解码器,所述解码器能够对所述视频流进行解码或解压缩从而对它进行准备以便进行观看或进一步处理。对视频流进行编码能够包含在视频质量和比特流大小间加以权衡的参数,其中提高解码视频流的感知质量会增加发送或存储比特流所需的比特数量。一种实现突出压缩性能的技术通过空间和/或运动补偿预测而利用了视频信号的空间和时间相关性。预测之后的变换代码化是另一种改善视频压缩的技术。通常,变换代码化旨在大幅去除预测之后的残差像素之间的统计冗余。变换的压缩性能依赖于解除残差像素冗余的相关性并且将能量压缩为变换系数的子集的能力。基于正弦的变换类型最常被用于这样的相关性解除。在以低/中比特率利用诸如离散余弦变换的基于正弦的变换对锐利边缘或拐角进行代码化时常见到诸如振铃之类的伪像。常规地,这经常通过使用滤波器或者通过在边缘处或其附近使用更高质量的编码来解决。由于自然视频信号表示像素值通常逐渐或平滑变化的图像,所以与非基带视频信号相比,这对于自然视频信号是更小的问题。根据本文的教导在计算机屏幕内容的场境中经常看到的非基带信号(例如,文本幻灯片、用户界面),并且经由计算机图形(例如,动画)生成的场景由基于正弦的变换(本文也称作基于正弦的变换类型)和基于阶梯的变换(本文也称作基于阶梯的变换类型)之间的选择过程来编码。基于阶梯的变换被定义为完整的规格化正交变换基础的集合。也就是说,基础矢量互相正交,并且基础矢量的线性组合覆盖整个矢量空间。基于阶梯的变换能够更好地捕捉锐利边缘并且近似阶梯变化。在视觉质量方面,这样的变换自然低避免了振铃伪像。因此,允许选择基于阶梯的变换能够潜在地利用较低比特成本表示输入信号并且还更有效地压缩信号。进一步的细节在对可以在其中使用本文教导的环境的初始讨论之后加以描述。图1是视频编码和解码系统100的示意图。发送站102例如可以是具有诸如图2所描述的内部硬件配置的计算机。然而,发送站102的其它适当实施方式也是可能的。例如,发送站102的处理能够在多个设备间进行分布。网络104能够连接发送站102和接收站106以便对视频流进行编码和解码。特别地,视频流能够在发送站102中进行编码,并且经编码的视频流能够在接收站106中被解码。网络104例如可以是互联网。网络104也可以是局域网(LAN)、广域网(WAN)、虚拟私人网络(VPN)、蜂窝电话网,或者用于将视频流从发送站102发送至在该示例中是接收站106的任意其它装置。在一个示例中,接收站106可以是具有诸如图2所描述的内部硬件配置的计算机。然而,接收站106的其它适当实施方式也是可能的。例如,接收站106的处理能够在多个设备间进行分布。视频编码和解码系统100的其它实施方式是可能的。例如,实施方式能够省略网络104。在另一个实施方式中,视频流能够被编码并接着被存储以便在随后的时间被传送至接收站106或者具有存储器的任意其它设备。在一个实施方式中,接收站106接收(例如,经由网络104、计算机总线和/或一些通信路径)经编码的视频流,并且存储视频流以便随后解码。在示例实施方式中,使用实时传输协议(RTP)来在网络104上传送编码视频。在另一个实施方式中,可以使用RTP以外的传输协议,例如基于HTTP的视频流传输协议。例如,当在视频会议系统中使用时,发送站102和/或接收站106可以包括如以下所描述的编码和解码视频流的能力两者。例如,接收站106可以是视频会议参与者,其从视本文档来自技高网...

【技术保护点】
1.一种用于对编码图像数据进行解码的方法,包括:/n接收编码比特流;/n根据所述编码比特流内的比特,确定被编码在所述编码比特流内的图像数据的块的变换信息,其中,通过以下操作来确定所述变换信息:/n针对当前帧的多个块中的当前块,并且针对多个预测模式中的预测模式:/n使用所述预测模式生成预测块以用于对所述当前块进行编码;/n基于所述预测块和所述当前块生成残差块;/n将使用所述预测模式生成的所述残差块的大小与变换块的最小块大小进行比较;/n响应于确定所述残差块的大小等于所述最小块大小:/n使用基于正弦的变换对所述残差块进行变换;/n生成第一率失真值以用于使用所述基于正弦的变换对所述残差块进行编码;/n使用基于阶梯的变换对所述残差块进行变换;以及生成第二率失真值以用于使用所述基于阶梯的变换对所述残差块进行编码;/n响应于确定所述残差块的大小超过所述最小块大小:/n针对所述残差块的多个非重叠子块中的每个子块:/n使用所述基于正弦的变换对所述子块进行变换;以及/n使用所述基于阶梯的变换对所述子块进行变换;/n通过使用所述基于正弦的变换对所述多个子块进行编码来生成所述第一率失真值;以及/n通过使用所述基于阶梯的变换对所述多个子块进行编码来生成所述第二率失真值;/n基于所述预测模式的结果中所述第一率失真值和所述第二率失真值中的最低值,选择所述基于阶梯的变换或所述基于正弦的变换以用于对所述残差块进行编码;以及/n使用所述变换信息来对所述当前块进行解码。/n...

【技术特征摘要】
20150914 US 14/853,2151.一种用于对编码图像数据进行解码的方法,包括:
接收编码比特流;
根据所述编码比特流内的比特,确定被编码在所述编码比特流内的图像数据的块的变换信息,其中,通过以下操作来确定所述变换信息:
针对当前帧的多个块中的当前块,并且针对多个预测模式中的预测模式:
使用所述预测模式生成预测块以用于对所述当前块进行编码;
基于所述预测块和所述当前块生成残差块;
将使用所述预测模式生成的所述残差块的大小与变换块的最小块大小进行比较;
响应于确定所述残差块的大小等于所述最小块大小:
使用基于正弦的变换对所述残差块进行变换;
生成第一率失真值以用于使用所述基于正弦的变换对所述残差块进行编码;
使用基于阶梯的变换对所述残差块进行变换;以及生成第二率失真值以用于使用所述基于阶梯的变换对所述残差块进行编码;
响应于确定所述残差块的大小超过所述最小块大小:
针对所述残差块的多个非重叠子块中的每个子块:
使用所述基于正弦的变换对所述子块进行变换;以及
使用所述基于阶梯的变换对所述子块进行变换;
通过使用所述基于正弦的变换对所述多个子块进行编码来生成所述第一率失真值;以及
通过使用所述基于阶梯的变换对所述多个子块进行编码来生成所述第二率失真值;
基于所述预测模式的结果中所述第一率失真值和所述第二率失真值中的最低值,选择所述基于阶梯的变换或所述基于正弦的变换以用于对所述残差块进行编码;以及
使用所述变换信息来对所述当前块进行解码。


2.根据权利要求1所述的方法,其中,所述基于阶梯的变换是Walsh-Hadamard变换。


3.根据权利要求1或2所述的方法,其中,所述基于正弦的变换是离散余弦变换。


4.根据权利要求1所述的方法,其中:
所述基于阶梯的变换是Walsh-Hadamard变换;以及
其中,通过下述操作对所述当前块进行编码:通过使用所述Walsh-Hadamard变换对所述多个非重叠的子块中的每个子块进行逆变换以相应地形成变换子块并且在没有对所述变换子块执行量化的情况下对所述变换子块进行熵代码化,来对每个子块进行无损编码。


5.根据权利要求1所述的方法,其中:
所述基于阶梯的变换是Harr小波变换;以及
其中,通过下述操作对所述当前块进行编码:使用所述Harr小波变换对所述多个非重叠的子块中的每个子块进行无损编码。


6.一种用于对编码图像数据进行解码的装置,包括:
处理器,所述处理器被配置成:
接收编码比特流;
根据所述编码比特流内的比特,确定被编码在所述编码比特...

【专利技术属性】
技术研发人员:韩敬宁许耀武陈诚
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1