用于编码图像和/或音频数据的方法及设备技术

技术编号:2948556 阅读:151 留言:0更新日期:2012-04-11 18:40
公开了用于对先前编码的数据源(100,105,140)执行结构化编码的方法和设备,其中结构(200,210,220,230)并未在所接收到的数据中定义。本发明专利技术特别应用于数字化图像或音频数据的基于块的压缩(例如使用MPEG编码的压缩),所述数字化图像或音频数据是从模拟数据源得到的。该编码在块边界(200,210,220,230)上的像素颜色和/或亮度中引入不连续,从而导致质量显著恶化和带宽的低效使用。利用与先前所使用的相同的块和像素结构对数据编码,可以使得这些不连续实际上不可见,从而基本上消除这些问题。为此,对接收到的数据进行处理(300)从而检测先前编码和解码的数据内包含的伪像,通过分析这些伪像可以提取出关于由先前编码处理(100,105,140)在数据上施加的结构信息(200,210,220,230)的信息,并通过参照这些提取出的结构信息来编码所接收到的数据。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及用于编码从一个源接收到的数据的方法及设备,其中该编码是对数据施加一种结构的类型,所述结构并未在所接收到的数据中定义。本专利技术特别应用于例如使用MPEG编码对数字化的图像或音频数据进行基于块的压缩,所述数字化的图像或音频数据是由模拟源得到的。众所周知,图像,尤其是电视和视频记录应用的运动图片序列,可以以模拟或数字格式被传输和存储。数字化传输和存储对于专业的和消费者的应用正变得越来越切实可行。通常都需要将模拟源的图像进行数字化和编码以便用于传输或存储,反之亦然。这些图像可以是例如由数字摄影得到的、或者是由胶片或纸张扫描得到的静止图像,也可以是由运动图片序列形成的图像流。由摄像机或记录装置得到的数字视频可以被转换成模拟的形式用于广播,然后被再次转换成数字的形式用于存储,例如存储在家用数字录像机(DVR)设备中。数字传输和存储系统通常使用基于块的压缩方式(例如JPEG或MPEG-2)来实现在可用的传输带宽和存储容量范围内的可以接受的图像质量。JPEG是一种基于对像素数据组、块执行离散余弦变换(DCT)的视频压缩系统。MPEG-2是一种基于相同原理的运动视频压缩系统。为了实现充分的数据压缩,对表示每个像素块的DCT系数进行自适应量化和可变长编码(VLE)。将这些块每四个分成一组,形成“宏块”,从而色度(颜色)分量可以以亮度(辉度)分量的空间分辨率的一半来表示。这些技术可以被应用在静止图像(JPEG)和运动视频(MPEG)中。对于运动图片,在宏块的基础上执行运动补偿的帧间预测编码来实现进一步的压缩。由于量化,这些压缩系统都是“有损”的系统,因此被编码的数据在解码之后与编码之前的原始数据并非完全一样。这本身可以表现为像素的亮度差异和/或色度差异,所有这些通常都表现为重建图像中的噪声。在JPEG和MPEG这样的基于块的压缩系统中,一种特别显著的噪声就是出现在块边界处的像素颜色和/或辉度的不连续性。这些伪像在这里将被称为“块噪声”。人眼对这种对比度的突然变化非常敏感,例如以叠加在普通的运动图像上的格状图案形式出现的样子。例如EP0998146A中就描述了一种设备,用于检测块噪声和平滑块边界处的不连续性,从而使被观看图像中的块边界的突出性最小。压缩编码器通常在图像质量和传输带宽或文件大小之间实施一种连续的折衷办法。可提供的图像质量很大程度上依赖于源图像的内容和质量。源图像中的噪声会导致质量的显著恶化,因为比起系统所设计用于的更为相关的信号,要表示随机特征的代价固有地更高。另一方面,对已用所述方法编码过的图像进行重复解码和再次编码并不会必然导致更大的恶化,因为剩余的信息已经适合于再编码处理在可用带宽内所能再现的内容。尽管被再次编码的图像可能包含显著的块噪声,例如由于每个块都由DCT处理单独处理,这些伪像可能在再编码图像中被再现,但它们不会被混合,也不会消耗任何额外带宽,因为它们对再编码器来说实际上是“不可见的”。然而专利技术者已经认识到一个问题,其中包含块噪声的解码图像是以模拟形式被传输或存储的,然后再被提供到编码器用于数字传输或存储。这种情况下,在源图像中存在的块噪声伪像和编码器提供的块边界之间通常并不对准。结果,编码器将把块噪声“看作”将被编码的信号的一部分。然后,不仅在编码的图像中会再现这种块噪声,而且要表示在编码器的像素块中的这些明显的不连续性所需的带宽将减少表示真实图像内容的可用带宽,从而导致图像质量的显著恶化。在解码该图像的过程中,将包含两组块噪声,并且任何通过模拟信道的进一步传输和再编码将会使该问题更加严重。当根据MPEG-2这样的基于块的编码方法来处理运动视频时,一个帧序列被作为一个理论上采用了不同的编码方案的图片组(GOP)进行编码。所述编码方案通常包括内部编码的“I”帧,这种帧仅使用来自其自身的信息进行编码(类似于JPEG);预测编码的“P”帧,这种帧基于先前的I帧使用运动矢量进行编码;以及双向预测编码的“B”帧,这种帧根据对序列中先前的和以后的I帧和/或P帧的预测进行编码。编码方案的选择及其排列顺序将根据传送运动视频所使用的通信介质的完善性来决定。例如,若信道存在很高的破坏的可能性,则有可能在GOP中重复比对于更安全链路所使用的更多的“I”帧,从而可以在中断时快速重建图像。理想情况下,为了在解码和再编码步骤中实现最大压缩和最小恶化,将在所有的编码级中使用相同的GOP序列。EP0106779A试图与数字视频信号一起发送“历史”数据,从而可以根据原先数据流的GOP结构来执行再编码。然而,若这些图片已经在此期间通过了模拟域,那么就不能提供这种历史数据。当发生这种情况时,原先作为I帧的帧就可能被作为B帧或P帧来编码,原先的B帧或P帧随后可能被作为I帧来编码。通常这样会导致图片质量的损失,如果重复执行解码和再编码处理的话这将会更为严重。在对可能已经过先前压缩的模拟源的音频数据进行编码时也会出现类似的问题。例如,许多音频压缩系统将音频样本流划分为许多短块,这些短块类似于像素块但却是一维的,音频压缩系统根据每个块的频谱内容对每个块进行编码。这种情况下,这些块代表的是时域结构而不是空间结构,但块边界伪像的存在和带宽挪用问题仍会带来与上述问题类似的问题。因此,本专利技术的一个目的是提供了改进的方法和设备,用于对得自模拟源的例如图像和声音这样的数据执行基于块的编码,特别是提供了能够保持先前已经进行了基于块的编码并包含块噪声或其他结构化伪像的图像/声音的质量的方法。根据本专利技术的第一方面,提供了一种对从源接收的数据进行编码的方法,其中该编码属于对数据施加一种结构的类型,该结构并未在所接收到的数据中定义,该方法包括以下步骤分析所接收的数据,以检测该数据中包含的伪像,该伪像指示该数据先前已经过了相同类型的编码和解码处理;通过分析所述伪像而提取关于由所述先前编码处理施加在该数据上的结构的信息;参照所提取的结构信息而对接收的数据进行编码。可以执行该编码步骤以便能够使由该编码处理施加的结构和由先前编码处理所施加的结构之间的对准最大化。从以下的例子可以看出,通过使用和以前相同的结构进行编码,能够使图像或音频数据在减小了质量恶化的情况下通过一个包括多个编码/解码级的系统传播。本专利技术的一个特别优点是,能够避免由于对先前编码处理中的伪像进行不必要编码而造成的带宽消耗。当接收的数据表示图像时(例如是通过模拟的传输或存储处理接收的图像),则由该编码处理施加的结构可能包括一种空间结构,其中图像的像素按块进行处理,并且执行编码以便能够使该编码处理的块边界与存在于所接收的图像数据中的作为先前编码的结果的块边界伪像基本上对准。该编码处理可以属于施加一种空间结构的类型,在该空间结构中像素块被分组成为宏块。这种情况下,可以执行编码以便能够使该编码处理的宏块边界与存在于所接收的图像数据中的作为先前编码的结果的宏块边界伪像基本上对准。在通过JPEG或MPEG得到图像数据中,宏块边界的伪像只能在图像数据的色度分量中检测到,而不是亮度数据。术语“块”应当被解释为包含“宏块”,除非上下文中需要其他的解释。在图像的色度和亮度分量之间的相对分辨率没有预先固定的情况下,在色度和亮度分量中分别对块边界伪像进行检测,也将允许把确定相对分辨率作为一个预备步本文档来自技高网...

【技术保护点】
一种对从源(100,105,140)接收的数据进行编码的方法,其中该编码属于对数据施加一种结构(200,210,220,230)的类型,该结构并未在接收到的数据中定义,该方法包括以下步骤:-分析(300)所接收的数据,以检测该数据中 包含的伪像,所述伪像指示该数据已经经过了相同类型的先前的编码和解码处理(105,110,140);-通过分析所述伪像而提取出关于由所述先前编码处理施加在该数据上的结构的信息;-参照所提取的结构信息而对接收到的数据进行编码。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:RJ卡德维里
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1