将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法技术

技术编号:3045582 阅读:150 留言:0更新日期:2012-04-11 18:40
一种用于将数字信号编码成可扩缩比特流的方法,包括:量化数字信号,并对量化信号进行编码以形成核心层比特流;基于数字信号和核心层比特流执行误差映射以除去已被编码成核心层比特流的信息,产生误差信号;基于数字信号的感知信息对误差信号进行比特平面编码,产生增强层比特流,其中数字信号的感知信息使用感知模型确定;以及复用核心层比特流和增强层比特流,从而产生可扩缩比特流。一种用于将可扩缩比特流解码成数字信号的方法,包括:将可扩缩比特流解复用成核心层比特流和增强层比特流;对核心层比特流进行解码和解量化以产生核心层信号;基于数字信号的感知信息对增强层比特流进行比特平面解码;以及基于被比特平面解码的增强层比特流和被解量化的核心层信号执行误差映射,产生重构的变换信号,其中重构的变换信号是数字信号。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
目前,随着计算机的发展,在诸如因特网、无线局域网、家庭网络和商业蜂窝电话系统的网络上对音频内容进行联网和通信流,正在成为传送音频服务的主流方法。相信随着包括xDSL、光纤和宽带无线接入的宽带网络设施的发展,这些信道的比特率会很快接近用于传送高采样率、高幅值分辨率(例如96kHz,24比特/采样)的无损音频信号的信道的比特率。另一方面,仍然存在需要诸如MPEG-4(如[1]中所述)的高压缩数字音频格式的应用领域。因此,非常需要能桥接当前信道和迅速出现的宽带信道的能共同使用的解决方法。另外,即使在宽带信道广泛可使用并且带宽限制最终消除时,能够产生比特率可在传输过程中动态变化的分层比特流的比特率可扩缩编码系统仍是非常有益的。例如,对于因故障或资源共享要求有时发生分组丢失的应用,当前诸如PCM(脉冲编码调制)的宽带波形表示和无损编码格式可能在流情况中受到严重的失真。但是,如果可以在网络资源动态变化的情况下设置分组的优先级,就可以解决这个问题。最后,比特率可扩缩编码系统还提供对音频流服务有利的服务器,其中,如果来自客户机站点的需求的数量过多,则可以实现适度的QoS降低。之前,已经提出许多无损音频编码算法(见[2]-[8])。大多数方法依赖预测滤波器以除去原始音频信号的冗余,而残差被熵编码(如[5]至[12]中所述的)。由于预测滤波器的存在,因此将由这些基于预测的方法产生的比特流进行扩缩以实现比特率可扩缩性是困难且效率不高的(见[5],[6]),如果可能的话。其它如[3]中所述的方法通过两层法建立无损音频编码器,其中,原始音频信号首先用有损编码器进行编码,然后,其残差用残差编码器进行无损编码。尽管这种两层设计提供了某种比特率可扩缩性,但是其粒度过粗而不适于音频流应用。之前,在[4]和[18]中提出了对比特率提供细粒度可扩缩性的音频编解码器,但是,与在此将要讨论的系统不同,那些编解码器不提供后向兼容性,即由这两个编解码器产生的有损比特流与任何现有的音频编解码器都不兼容。在[21]、[22]、[23]中描述了感知模型。本专利技术的目的在于提供一种用于将数字信号编码成可扩缩比特流的方法,其中保持后向兼容性。
技术实现思路
提供一种用于将数字信号编码成可扩缩比特流的方法,该方法包括量化数字信号,并对量化信号编码以形成核心层比特流;基于数字信号和核心层比特流执行误差映射以除去已被编码成核心层比特流的信息,产生误差信号;基于数字信号的感知信息对误差信号进行比特平面编码,产生增强层比特流,其中数字信号的感知信息使用感知模型确定;以及复用核心层比特流和增强层比特流,从而产生可扩缩比特流。另外,根据上述方法,提供一种将数字信号编码成可扩缩比特流的编码器、计算机可读介质、计算机程序元件、一种将可扩缩比特流解码成数字信号的方法、一种将可扩缩比特流解码成数字信号的解码器、另一种计算机可读介质以及另一种计算机程序元件。在一个实施例中,提出一种无损音频编解码器,其实现具有以下特征的细粒度比特率可扩缩性(FGBS)-后向兼容性在无损比特流中嵌入诸如MPEG-4AAC比特流的高压缩核心层比特流。-在感知上嵌入的无损比特流在重构的音频中,无损比特流可被截断成任何有损速率,而不损失感知最优性。-低复杂度它在AAC(二进制算术编解码器)上仅增加了非常有限的计算以及非常有限的存储器。本音频编解码器所提供的丰富的功能性提出其能够用作“通用”音频格式,以满足不同音频流或存储应用的各种速率/质量的要求。例如,用作核心层比特流的遵循MPEG-4AAC的比特流可以很容易从使用该编解码器产生的比特流中提取,用于传统的MPEG-4AAC音频服务。另一方面,也可以由该编解码器提供无损压缩,以用于具有无损重构要求的音频编辑或存储应用。在需要FGBS的音频流应用中,该编解码器的无损比特流可以进一步被截断成在编码器/解码器或在通信信道中较低的比特率,以用于任何可以在实际系统中出现的速率/保真度/复杂度限制。在一个实施例中,提供一种对数字信号进行编码以形成可扩缩比特流的方法,其中可扩缩比特流可以在被解码器解码时在任何点被截断以产生较低质量(有损的)信号。所述方法可用于对任何类型的数字信号进行编码,例如音频、图像或视频信号。与物理被测信号对应的数字信号可以通过扫描对应的模拟信号的至少一个特性特征(例如,视频信号的亮度和色度值,模拟声音信号的幅值,或者来自传感器的模拟传感信号)产生。例如,麦克风可以用于捕捉模拟音频信号,然后通过对捕捉的模拟音频信号进行采样和量化将其转换成数字音频信号。摄影机可以用于捕捉模拟视频信号,然后使用适合的模数转换器将其转换成数字视频信号。可选择地,数码相机可用于直接将图像或视频信号捕捉到图像传感器(CMOS或CCD)上作为数字信号。数字信号被量化和编码以形成核心层比特流。核心层比特流形成可扩缩比特流的最小比特率/质量。增强层比特流用于提供可扩缩比特流的附加比特率/质量。根据本专利技术,通过基于变换信号和核心层比特流执行误差映射以产生误差信号,形成增强层比特流。执行误差映射的目的在于除去已被编码成核心层比特流的信息。对误差信号进行比特平面编码以形成增强层比特流。误差信号的比特平面编码是基于数字信号的感知信息即被感知或感知的重要性而执行的。本专利技术中使用的感知信息是指与人类感觉系统相关的信息,例如人类视觉系统(即人眼)和人类听觉系统(即人耳)。这种数字信号(视频或音频)的感知信息使用感知模型获得,例如MPEG-1音频中用于音频信号的心理声学模型I或II(如[21]中所述的)、用于图像的人类视觉系统模型(如[22]中所述的)以及在视频中使用的时空模型(如[23]中所述的)。心理声学模型是基于人耳只能获取依赖各种环境条件的某一频段内的声音的效果的。类似地,HVM(人类视觉模型)是基于人眼更注意确定的动作、颜色和对比的效果的。核心层比特流和增强层比特流被复用以形成可扩缩比特流。可扩缩比特流可以被解码以无损地重构数字信号。如上所述,核心层比特流是形成可扩缩比特流的最小比特率/质量的嵌入式比特流,并且增强层比特流形成可扩缩比特流的有损到无损部分。由于增强层比特流在感知上进行比特平面编码,因此增强层比特流可按照使得增强层比特流中在感知上不太重要的数据首先被截断的方式被截断,以便提供可扩缩比特流的感知可扩缩性。换句话说,可扩缩比特流可通过截断增强层比特流进行扩缩,这样增强层比特流以及因此的可扩缩比特流即使在被截断成较低的比特率/质量时,也可以在感知上最优化。根据本专利技术的方法可在高带宽或高保真系统中用作诸如图像、视频或音频信号的数字信号的无损编码器。当带宽要求改变时,由编码器产生的比特流的比特率可以相应地改变,以满足带宽要求的变化。这种方法可在许多应用和系统中实现,例如JPEG 2000的MEG音频、图像和视频压缩。根据本专利技术的实施例,在对数字信号进行量化以形成量化信号之前,将数字信号变换到适合域。数字信号可以在相同的域内进行变换,或者从一个域变换到另一个域以更好地表示数字信号,并从而允许对数字信号进行容易和有效的量化和编码以形成核心层比特流。这样的域可包括但不限于时域、频域以及时域与频域的混合。数字信号的变换甚至可以用酉矩阵I执行。在一个实施例中,使用整数修正离散本文档来自技高网
...

【技术保护点】
一种用于将数字信号编码成可扩缩比特流的方法,包括:-量化数字信号,并对量化信号进行编码以形成核心层比特流;-基于数字信号和核心层比特流执行误差映射以除去已被编码成核心层比特流的信息,产生误差信号;-基于数字信号的感知信息对误差信号进行比特平面编码,产生增强层比特流,其中数字信号的感知信息使用感知模型确定;以及-复用核心层比特流和增强层比特流,从而产生可扩缩比特流。

【技术特征摘要】
【国外来华专利技术】US 2003-10-10 60/510,6291.一种用于将数字信号编码成可扩缩比特流的方法,包括-量化数字信号,并对量化信号进行编码以形成核心层比特流;-基于数字信号和核心层比特流执行误差映射以除去已被编码成核心层比特流的信息,产生误差信号;-基于数字信号的感知信息对误差信号进行比特平面编码,产生增强层比特流,其中数字信号的感知信息使用感知模型确定;以及-复用核心层比特流和增强层比特流,从而产生可扩缩比特流。2.如权利要求1所述的方法,还包括-将数字信号变换到适合域,其中在对量化信号进行编码之前对变换信号进行量化以形成量化信号。3.如权利要求1或2所述的方法,其中,数字信号的感知信息进一步与核心层比特流和增强层比特流进行复用,以产生可扩缩比特流。4.如权利要求2所述的方法,其中,使用整数修正离散余弦变换将数字信号变换成变换数字信号。5.如权利要求4所述的方法,其中,对变换信号进行归一化以近似MDCT滤波器组的输出。6.如权利要求1到5任一所述的方法,其中,数字信号或变换数字信号根据运动图像专家组(MPEG)先进音频编码(AAC)规范进行量化和编码。7.如权利要求1到6任一所述的方法,其中,误差映射通过从数字信号或变换数字信号中减去与量化信号的每个量化值对应的较低量化阈值执行,从而产生误差信号。8.如权利要求1到7任一所述的方法,其中,心理声学模型被用作用于确定数字信号的感知信息的感知模型。9.如权利要求1到8任一所述的方法,其中,误差信号被表示在包含多个比特平面符号的比特平面中,并且所述比特平面基于数字信号的感知信息进行位移,使得当所述比特平面在误差信号的比特平面编码过程中以连续的顺序进行扫描和编码时,在感知上更重要的比特平面首先被编码。10.如权利要求1到8任一所述的方法,其中,误差信号被表示在包含多个比特平面符号的比特平面中,并且所述比特平面和比特平面符号基于数字信号的感知信息在误差信号的比特平面编码过程中顺序地进行扫描和编码,使得在感知上更重要的比特平面的比特平面符号首先被编码。11.如权利要求9或10所述的方法,其中,以下信息中的至少一个被感知模型确定为数字信号的感知信息-误差信号的比特平面编码开始的误差信号的比特平面M(s),;以及-数字信号的恰可察觉失真(JND)级别,其中s对应于数字信号或变换数字信号的频带。12.如权利要求11所述的方法,其中,数字信号的感知重要度Ps(s)被进一步确定为感知信息,所述感知重要度通过以下步骤确定-确定与数字信号的JND级别τ(s)对应的误差信号的比特平面;-从误差信号的比特平面编码开始的误差信号的比特平面M(s)中减去与数字信号的JND级别τ(s)对应的误差信号的比特平面,从而确定感知重要度Ps(s),其中感知重要度Ps(s)用于控制至少比特平面或比特平面的比特平面符号的扫描和编码顺序。13.如权利要求12所述的方法,其中,感知重要度Ps(s)通过以下步骤进行归一化-基于感知重要度Ps(s)的函数定义公共感知重要度Ps(s)_common;以及-从感知重要度Ps(s)中减去公共感知重要度Ps(s)_common,从而产生归一化的感知重要度Ps′(s),其中对于量化值不全为零的频带s,感知重要度Ps(s)的值被设置为公共感知重要度Ps(s)_common的值;其中,对于量化值全为零的频带s,将归一化的感知重要度Ps′(s)与核心层比特流和增强层比特流复用,以产生可扩缩比特流。14.如权利要求11所述的方法,其中,误差信号的比特平面编码开始的误差信号的比特平面根据在频带s中用于量化数字信号或变换信号的最大量化间隔确定。15.一种用于将数字信号编码成可扩缩比特流的编码器,包括-量化单元,用于量化数字信号,并对量化信号进行编码以形成核心层比特流;-误差映射单元,用于基于数字信号和核心层比特流执行误差映射以除去已被编码成核心层比特流的信息,产生误差信号;-感知比特平面编码单元,用于基于数字信号的感知信息对误差信号进行比特平面编码,产生增强层比特流,其中数字信号的感知信息使用感知模型确定;以及-复用单元,用于复用核心层比特流和增强层比特流,从而产生可扩缩比特流。16.一种计算机可读介质,具有在其上记录的程序,其中当通过计算机执行所述程序时,所述程序使计算机执行用于将数字信号编码成可扩缩比特流的过程,所述过程包括-量化数字信号,并对量化信号进行编码以形成核心层比特流;-基于...

【专利技术属性】
技术研发人员:俞容山林晓王逸平
申请(专利权)人:新加坡科技研究局
类型:发明
国别省市:SG[新加坡]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利