音频编码制造技术

技术编号:3688802 阅读:136 留言:0更新日期:2012-04-11 18:40
在双声道立体声编码中,仅对一个单声道进行编码。附加层保存参数以便检索左、右信号。公开一种编码器,它把从单声道编码信号提取的瞬态信息链接到参数多声道层,从而提供增加的性能。瞬态位置可以直接从比特流中得到,或者也可从其它编码参数(例如mp3中的窗口交换标志)中估算。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及音频编码
技术介绍
在传统的基于波形的音频编码方案、如MPEG-LII、mp3和AAC(MPEG-2高级音频编码)中,通过把两个单声道音频信号编码为一个比特流来对立体声信号编码。但是,通过以诸如中/侧立体声编码和强度编码之类的技术利用信道间相关性和不相关性,可进行比特率节省。在中/侧立体声编码的情况下,具有大量单声道内容的立体声信号可分为和M=(L+R)/2以及差S=(L-R)/2信号。这个分解有时与主要分量分析或时变比例因子结合。然后,通过参数编码器或者波形编码器(例如变换或子带编码器)独立地将这些信号编码。对于某些频率范围,这种技术可能为M或S信号产生略高的能量。但是,对于某些频率范围,可为M或S信号获得能量的显著减少。通过这种技术得到的信息量减少主要取决于源信号的空间属性。例如,如果源信号为单声道的,则差信号为零并且可被丢弃。但是,如果左和右音频信号的相关性很低(对于较高频率范围,常常是这样),则这个方案几乎未提供优点。在强度立体声编码的情况下,对于某些频率范围,仅一个信号I=(L+R)/2与L和R信号的强度信息一起编码。在解码器侧,在利用对应的强度信息对这个信号I进行缩放之后将其用于L和R信号。在这种技术中,高频(通常在5kHz以上)由单一音频信号(即单声道)表示,与时变和频率相关比例因子结合。音频信号的参数描述在过去数年中已经受到关注,尤其是在音频编码领域。已经表明,描述音频信号的传输(量化)参数只要极少的传送容量在接收端重新合成感觉相等的信号。但是,当前的参数音频编码器重点放在对单声道信号编码,而立体声信号则常常作为双单声道来处理。EP-A-1107232公开一种产生由左声道信号和右声道信号组成的立体声音频信号的表示的参数编码方案。为了有效地利用传输带宽,这种表示包含仅与或者是左声道信号或者是右声道信号的单声道信号有关的信息以及参数信息。另一个立体声信号可根据单声道信号结合参数信息来恢复。参数信息包含立体声音频信号的定位线索,包括左右声道的强度和相位特性。在双声道立体声编码中,与强度立体声编码相似,仅对一个单声道进行编码。附加侧信息保存参数以便检索左、右信号。2002年4月提交的欧洲专利申请第02076588.9号(代理人档案号PHNL020356)公开了多声道音频的参数描述,它涉及Breebaart等人在以下文献中提出的双声道处理模型“Binaural processing model based oncontralateral inhibition.I.Model setup”,J.Acoust.Soc.Am.,110,1074-1088,2001年8月;“Binaural processing model based on contralateralinhibition.II.Dependence on spectral parameters”,J.Acoust.Soc.Am.,110,1089-1104,2001年8月;以及“Binaural processing model based oncontralateral inhibition.III.Dependence on temporal parameters” ,J.Acoust.Soc.Am.,110,1105-1117,2001年8月,公开了一种双声道处理模型。这包括把输入音频信号分为若干限带信号,它们按照(等效矩形带宽)ERB速率比例来线性间隔。这些信号的带宽取决于中心频率,跟随ERB速率。随后,对于每个频带,分析输入信号的以下属性由出自左、右耳的限带信号的相对电平所定义的耳间电平差(ILD),耳间时间(或相位)差(ITD或IPD),由对应于耳间互相关函数中的峰值的耳间延迟(或相移)来定义,以及无法通过ITD或ILD说明的波形相似性(相异性),可通过最大耳间互相关(即在最大峰值的位置的互相关值)来参数化。因此,从以上公开中知道,任何多声道音频信号的空间属性可通过指定ILD、ITD(或IPD)以及最大相关、作为时间和频率的函数来描述。这种参数编码技术为一般的音频信号提供相当优良的质量。但是,特别是对于具有较高不稳定性能的信号,例如响板、大键琴、钟琴等,该技术就会遇到前回声人工信号。本专利技术的一个目的是提供一种音频编码器和解码器以及相应的方法,它们减少与参数多声道编码有关的人工信号。专利技术公开根据本专利技术,提供一种如权利要求1所述的对音频信号编码的方法以及一种如权利要求13所述的对比特流解码的方法。根据本专利技术的一个方面,对多声道音频信号的空间属性进行参数化。空间属性最好包括左右信号之间的电平差、时间差以及相关性。利用本专利技术,瞬态位置直接或间接地从单声道信号中提取,并链接到参数多声道表示层。在参数多声道层中利用这个瞬态信息提供提高的性能。普遍认为,在许多音频编码器中,用瞬态信息来指导编码过程以取得更好的性能。例如,在WO01/69593-A1中所述的正弦编码器中,瞬态位置被编码到比特流中。编码器可把这些瞬态位置用于比特流的自适应分段(自适应组帧)。另外,在解码器中,这些位置可用来指导正弦和噪声合成的开窗。但是,这些技术一直局限于单声道信号。在本专利技术的优选实施例中,在对已经由这种正弦编码器产生了单声道内容的比特流进行解码时,瞬态位置可直接从比特流中得出。在波形编码器、如mp3和AAC中,瞬态位置不是直接编码在比特流中;而是假定例如在mp3的情况下,通过在单声道层中交换到更短的窗口长度(窗口交换)来标记瞬态间隔,因此可根据例如mp3窗口交换标志等参数来估算瞬态位置。附图简介下面将通过实例,参照附图来描述本专利技术的优选实施例,附图中附图说明图1是示意图,说明根据本专利技术的一个实施例的编码器;图2是示意图,说明根据本专利技术的一个实施例的解码器;图3表示编码在单声道信号的各个子帧以及多声道层的对应帧中的瞬态位置;以及图4表示来自单声道编码层的瞬态位置用于对参数多声道层解码的实例。优选实施例说明现在参照图1,图中表示根据本专利技术的一个优选实施例的编码器10,它用于对包含左(L)和右(R)输入信号的立体声音频信号编码。在优选实施例中,如2002年4月提交的欧洲专利申请第02076588.9号(代理人档案号PHNL020356)中所述,编码器用以下各项描述多声道音频信号一个单声道信号12,包括多个输入音频信号的组合,以及对于各个附加声道,一组空间参数14包括最好是用于每个时间/频率间隙的两个定位线索(ILD和ITD或IPD)以及描述无法通过ILD和/或ITD说明的波形相似性或相异性(例如互相关函数的最大值)的参数(r)。空间参数集可被音频编码器用作增强层。例如,如果仅允许低比特率,则传送单声道信号,同时,通过包含空间增强层,解码器可再现立体声或多声道声音。可以看到,虽然在本实施例中,一个空间参数集与单声道(单一信道)音频编码器结合,以便对立体声音频信号编码,但整体思想可应用于n声道音频信号,其中n>1。因此,如果传送(n-1)个空间参数集,则本专利技术原则上可用于从一个单声道信号产生n个声道。在这些情况下,空间参数描述如何从单一单声道信号形成n个不同的音频声道。因此,在解码器中,通过将空间参数的后续集与单声道编码信号结合,得本文档来自技高网...

【技术保护点】
一种对音频信号编码的方法,所述方法包括:产生单声道信号,分析至少两个音频信道的空间特性以得到连续时隙的一个或多个空间参数集,响应在给定时间包含瞬态的所述单声道信号,为包含所述瞬态时间的周期确定所述空间参数集的不均匀时间分段,以及产生包含所述单声道信号和所述一个或多个空间参数集的编码信号。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:EGP舒杰斯AWJ奥门
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1