通过平滑块伪影改进压缩视频信号的质量的系统和方法技术方案

技术编号:7140354 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及系统和方法,其中对于给定量的需要表示压缩视频信号的数据,如由典型的人类观察者察觉到的,提高了未被压缩显示的实时视频的质量。这里的系统和方法通过减弱块的出现实现这种改进,而不一定需要事先知道它们的位置。这里描述的这些方法减弱了这些块的出现,使得由HVS察觉到的所产生的实时视频的质量被提高。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数字视频信号,更具体地涉及通过将视频信号分离成去块(Deblock) 区和细节区(Detail region)、以及通过平滑去块区,来提高压缩数字视频信号的质量的系 统和方法。
技术介绍
众所周知的是,与表示文本信息或声频信号的所需要的数字数据的量相比,视频 信号由大量的数字数据所表示。因此当数字视频信号以高比特率传输时,尤其是当这些比 特率必须对应于视频显示装置所需要的实时数字视频信号时,数字视频信号占据相当大的 带宽。尤其是,在例如为电缆或者光纤的通信信道上同时传输和接收大量的不同的视频 信号常常是通过以在不同的通信信道中共享可用带宽的方式频分复用或者时分复用这些 视频信号来实现。数字化的视频数据通常在根据国际认同的格式标准(例如MPEG2、MPEG4、H264)的 格式化的媒体文件中嵌入音频和其它数据。这些文件通常在互联网上分布和多路传输,并 且分别存储在计算机的数字存储器、移动电话、数码摄像机中以及存储在光碟(CD)和数字 化视频光盘(DVD)上。许多这些装置被物理上的难以察觉地结合到单个装置中。在创建格式化的媒体文件的过程中,对文件数据进行各种级别和类型的数字压缩 以降低它们再现所需要的数字数据的量,由此减少所需要的记忆存储量以及减少当与许多 其它视频文件多路复用时的准确可靠的同时传输所需要的带宽。互联网提供一个特别复杂的传输视频数据的例子,其中当终端用户从中央服务器 下载视频文件的传输过程中,视频文件以许多不同的方式沿着许多不通的信道(即路径) 多路传输。然而,在几乎所有的情况下,对于给定的原始数据视频源和给定的终端用户的接 受和显示视频的质量,期望使获得的视频文件被压缩至最小可能的尺寸。格式化的视频文件可以表示完全数字化的影片。影片文件可以“按需”下载以用 于立即显示和实时观看,或者用于存储在终端用户的例如为数码摄像机的记录装置中,用 于将来实时观看。这些视频文件的视频部分的压缩不仅由于传输的目的而节约了带宽,还减少了存 储这些影片文件所需要的总存储量。在上述通信信道的接收终端,典型的是使用单用户计算和存储装置。这些单用户 装置的目前不同的例子为个人计算机和数字机顶盒,它们中的每个或全部典型地输出连接 到终端用户的视频显示装置(例如TV),直接或间接输入连接到有线铜分布电缆线(即有线 电视)。典型地,该电缆同时传输数百个实时多路传输的数字视频信号,并且常常输入连接 到一个光纤电缆,该光纤电缆从视频节目的本地分发服务器传输来自地面站的视频信号。 终端用户的卫星天线也用来接受广播视频信号。不论终端用户使用的是通过地球线缆还 是卫星所传输的视频信号,终端用户数字机顶盒或者等同设备通常被用来接收数字视频信号,以及选择要观看的特定的视频信号(即所谓TV频道或者TV节目)。这些传输的数字视 频信号常常为压缩数字格式,并且因此必须在由终端用户接收后进行实时解压缩。大多数的视频压缩方法通过仅保留原始未压缩的视频信号的数字近似值而减少 了数字视频数据的量。因此,在压缩之前的原始视频信号与被压缩的视频信号之间存在着较大差异。该 差异被定义为视频失真。对于给定的视频压缩方法,由于通过为这些方法选择不同参数而 降低被压缩的视频数据的数据量,视频失真的程度几乎总是变大。即,视频失真随着压缩程 度的增加而趋于增加。随着视频压缩程度的增加,视频失真最终对于人类视觉系统(HVQ变得可视的, 并且最终该失真在选择的显示装置上对于实时视频的通常观众而言变得明显的令人不愉 快。被观察到的该视频失真为所谓的伪影。视频伪影是HVS所解读出的不属于原始未压缩 的视频场景中的观察到的视频内容。已有用于在压缩过程中或者在压缩之后从压缩视频中显著减少明显的令人不愉 快的伪影的方法。这些方法中的大多数仅适用于使用基于块的二维OD)离散余弦转换 (DCT)或其近似法的压缩方法。下文中,我们称这些方法为基于DCT的。在这种情况下,迄 今为止的最明显的令人不愉快的伪影是在显示的视频场景中出现的伪影块。已有通常通过查找块或者通过需要块在视频的每个帧的位置的先验知识而减轻 伪影块的方法。对于视频数据已经预先被压缩和解压缩可能超过一次、或者视频数据已经预先被 调整了大小、转换了格式或者再混了颜色的广泛发生的情况下,减轻视觉上令人不愉快的 伪影的出现的问题尤其困难。例如,视频数据可能已经从NTSC重新被格式化为PAL格式, 或者从RGB格式转换为YCrCb格式。在这些情况下,几乎肯定不知道伪影块的位置的先验 知识,因此基于该知识的方法不起作用。用于减轻视频伪影的出现的方法必须不明显增加表示被压缩视频数据所需要的 数据总量。这一约束是主要的设计难题。例如,在显示的视频的每个帧中的每个像素的三色 中的每个颜色通常用8比特来表示,因此每个有色像素总计为M比特。例如,如果在压缩 的最大限度(此时有明显的令人不愉快的伪影),拟64(基于DCT)视频压缩标准能够实现 在其低端对应于大约每个像素一比特的1/40的视频数据的压缩。因此这对应于优于40x24 =960的平均压缩率。任何用于减轻视频伪影的方法在该压缩率时相对于每像素一比特的 1/40必须因此增加不显著数量的比特,当压缩比如此高以致于每像素的平均比特数典型地 小于一比特的1/40时,需要用于减轻块伪影的出现的方法。对于基于DCT的和其它的基于块的压缩方法,最严重的明显令人不愉快的伪影为 通常的随着时间、大小和方向变化的小矩形块的形式,该变化取决于视频场景的局部时空 特性。特别地,伪影块的性质取决于视频场景中的目标的局部运动和那些目标包含的空间 细节的量。对于一特定的视频,随着压缩比的增加,基于MPEG的基于DCT的视频编码器逐 渐地分配较少的比特给代表每个块内的像素的强度的所谓量化基础。每个块中分配的比特 的数目取决于与HVS有关的大量的心理视觉知识。例如,视频目标的形状和边缘以及它们 运动的光滑的时间轨迹在心理视觉方面是重要的,因此如在所有基于MPEG DCT的方法中, 必须分配比特以确保它们的保真度。随着压缩程度的增加,并且出于保持上述保真度的目的,压缩方法(在所谓的编 码器中)最终给每个块分配恒定(或者几乎恒定)的强度,这就是通常最明显的令人不愉 快的块伪影。预计,如果伪影块比它们最接近的相邻块之间的相对均一强度大3%,那么包 含这些块的空间区域是明显的令人不愉快的。在通过使用基于块的DCT型方法而严重压缩 的视频场景中,许多帧的大片区域包含这样的块伪影。
技术实现思路
本专利技术涉及一种系统和方法,其中对于给定量的需要表示压缩视频信号的数据, 如由典型的人类观察者察觉到的,提高了未被压缩显示的实时视频的质量。这里的系统和 方法通过减弱块的出现实现这种改进,而不一定需要事先知道它们的位置。在一些实施方 式中,这里描述的这些方法减弱了这些块的出现,使得如HVS察觉到的,所产生的实时视频 的质量被改进。就压缩视频和非压缩视频之间的强度差异而言,块状区域可能不是整个视频失真 的数学度量的最大促成者。在视频的细节区中通常有显著的数学失真,但是其利用如下事 实HVS不像察觉由于块伪影导致的失真一样察觉这种失真。在在此公开的实施方式中,该方法的第一步骤是将每个帧的数字表示分离成两部 分,即去块区本文档来自技高网
...

【技术保护点】
一种从图像帧中移除伪影的方法,所述伪影对HVS具有视觉破坏性,所述方法包括:  将每个图像帧的数字表示分离成去块区和细节区,所述去块区被去块,所述细节区保持基本上不去块。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:李奥那多·T·布朗顿
申请(专利权)人:寰宇娱乐巴巴多斯公司
类型:发明
国别省市:BB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1