本发明专利技术公开了一种音频编码器、音频编码方法和程序,该音频编码器包括:确定部,基于多个声道的音频信号的频谱,确定混合比率,该混合比率为针对多个声道中的每个声道,其它声道的频谱相对于该声道的混合后频谱的比率;混合部,基于确定部确定的混合比率,针对每个声道混合多个声道的频谱;以及编码部,对经混合部混合之后的多个声道的频谱进行编码。
【技术实现步骤摘要】
音频编码器和音频编码方法
本技术涉及一种音频编码器以及音频编码方法序,更具体地,涉及能够在高效地对多个声道的音频信号进行编码时防止由于编码而导致声音质量劣化的音频编码器和音频编码方法。
技术介绍
在用于对由多个声道的音频信号构成的立体声音频信号进行编码的公知技术当中,存在通过利用声道之间的关系来提高编码效率的M/S立体声编码技术、强度立体声编码技术等。在下文中,为了便于说明,立体声音频信号的声道数量是两个,即左声道和右声道,但是该说明同样可以适用于数量是三个或更多个的情况。M/S立体声编码生成构成立体声音频信号的右声道的音频信号和左声道的音频信号之间的和分量以及差分量作为编码结果。因此,由于当右声道的音频信号和左声道的音频信号彼此类似时差分量较小,因此编码效率较高。然而,由于当右声道的音频信号和左声道的音频信号彼此显著不同时差分量较大,因此难以获得高编码效率。这会在编码之后的量化时引起量化噪声,从而在解码时引起人工噪声。在强度立体声编码中,基于如下原理执行编码:人类听觉在高频域对相位迟钝,并且主要基于频谱之间的水平比(levelratio)来感测位置(例如,参见ISO/IEC13818-7Informationtechnology"GenericcodingofmovingpicturesandassociatedaudioinformationPart7",AdvancedAudioCoding(AAC))。具体地,对于低于预定频率FIS的频率,强度立体声编码按原样提供右声道和左声道的频谱作为编码结果。另一方面,对于等于或大于预定频率FIS的频率,强度立体声编码生成通过混合右声道和左声道的频谱而获得的共同谱以及各个声道的频谱的水平作为编码结果。因此,对于低于频率FIS的频率,解码器将作为编码结果的右声道和左声道的频谱按原样提供作为解码结果。另一方面,对于等于或大于频率FIS的频率,解码器将各个声道的频谱的水平应用于作为编码结果的共同谱,以生成解码结果。另外,对于这样的强度立体声编码,假定与M/S立体声编码的情况类似,右声道的音频信号和左声道的音频信号彼此类似。因此,当右声道的音频信号和左声道的音频信号彼此完全不同时,例如,当左声道的音频信号是钹(cymbals)的音频信号而右声道的音频信号是小号(trumpet)的音频信号时,由于共同谱不同于右声道和左声道的频谱,因此在解码时会出现人工噪声。因此,提出了计算右声道的音频信号的频谱与左声道的音频信号的频谱之间的距离的尺度,并且当该尺度等于或小于阈值时,执行诸如M/S立体声编码的共同编码,并且当该尺度等于或大于阈值时,单独地执行编码(例如,参见日本专利第3421726号,在下文中将其称为专利文献1)。此外,还提出了针对预定频带将立体声音频信号的频谱划分成段(piece),并且对于每个频带,使用特定的哈夫曼码本号来传送被应用了强度立体声编码的索引(例如,参见日本专利第3622982号,这在下文中被称为专利文献2)。因而,可以针对每个预定频带而在开与关之间切换强度立体声编码。然而,在专利文献1和2的技术的情况下,当在开与关之间频繁切换共同编码或强度立体声编码时,感测位置会变得不稳定或者会出现异常声音。另外,存在对于编码期望高压缩率的情形。即使在右声道的音频信号和左声道的音频信号彼此显著不同时,该情形也可能强制要求采用强度立体声编码以提高编码效率。在该情况下,在解码时肯定会出现可感测的人工噪声。同时,认为针对带而被划分成段的立体声音频信号基于编码的失真系数、以混合比率混合从而将其编码(例如,参见日本专利第3951690号)。在该情况下,由于基于失真系数连续地控制右边和左边的编码对象的分离(立体声感觉),因此可以防止感测位置不稳定或者可以防止异常声音的出现。图1是示出执行这样的编码的音频编码器的配置的一个示例的框图。图1中的音频编码器10被配置成包括滤波器组11、滤波器组12、自适应混合部13、T/F变换部14、T/F变换部15、编码控制部16、编码部17、多路复用器18以及失真系数检测部19。作为左声道的时间信号的音频信号xL和作为右声道的时间信号的音频信号xR作为编码对象的立体声音频信号被输入到图1中的音频编码器10。音频编码器10的滤波器组11将被输入作为编码对象的音频信号xL划分成相应的B个频带(带)的音频信号。滤波器组11将所划分的具有带号b(b=1,2,…,B)的子带信号xbL提供到自适应混合部13。类似地,滤波器组12将被输入作为编码对象的音频信号xR划分成相应的B个带的音频信号。滤波器组12将所划分的具有带号b(b=1,2,...,B)的子带信号xbR提供到自适应混合部13。自适应混合部13基于从失真系数检测部19提供的并且用于对过去的编码对象编码的失真系数,确定从滤波器组11提供的子带信号xbL与从滤波器组12提供的子带信号xbR的混合比率。具体地,自适应混合部13使得混合比率随着失真系数越大(即,S/N比率越小)而越大。因而,要通过进行混合而获得的子带信号针对右边和左边的分离(立体声感觉)变小,并且将提高编码效率。另一方面,自适应混合部13使得混合比率随着失真系数越小(即,S/N比率越大)而越小。因而,要通过进行混合而获得的子带信号针对右边和左边的分离(立体声感觉)变大。自适应混合部13基于所确定的子带信号xbL的混合比率而针对每个带混合子带信号xbL和子带信号xbR,以生成子带信号xbLmix。类似地,自适应混合部13基于所确定的子带信号xbR的混合比率而针对每个带混合子带信号xbL和子带信号xbR,以生成子带信号xbRmix。自适应混合部13将所生成的子带信号xbLmix提供到T/F变换部14,并且将子带信号xbRmix提供到T/F变换部15。T/F变换部14对子带信号xbLmix执行诸如MDCT(改进的离散余弦变换)的时频变换,并且将所得到的频谱XL提供到编码控制部16和编码部17。类似地,T/F变换部15对子带信号xbRmix执行诸如MDCT的时频变换,并且将所得到的频谱XR提供到编码控制部16和编码部17。编码控制部16基于从T/F变换部14提供的频谱XL与从T/F变换部15提供的频谱XR之间的关联,选择M/S立体声编码和强度编码这两种编码中的任一种编码方案。编码控制部16将所选择的编码方案提供到编码部17。编码部17使用从编码控制部16提供的编码方案对从T/F变换部14提供的频谱XL和从T/F变换部15提供的频谱XR中的每一个进行编码。编码部17将通过编码所获得的编码谱和关于编码的附加信息提供到多路复用器18。多路复用器18以预定格式对从编码部17提供的编码谱、关于编码的附加信息等进行多路复用,并且输出所得到的编码数据。失真系数检测部19检测编码部17的编码的失真系数,并且将其提供到自适应混合部13。
技术实现思路
然而,在图1的音频编码器10中,由于基于过去的编码对象的失真系数来确定混合比率,因此该混合比率不一定适合于当前编码对象的特征。结果,会出现由于编码而导致的声音质量的劣化。例如,即使当右声道的音频信号和左声道的音频信号彼此显著不同时,也会出现由于未充分混合右声道和左声道的频谱而引起的解码时的噪声。本技术是鉴于上本文档来自技高网...

【技术保护点】
一种音频编码器,包括:确定部,基于多个声道的音频信号的频谱,确定混合比率,所述混合比率为针对所述多个声道中的每个声道,其它声道的频谱相对于该声道的混合后频谱的比率;混合部,基于所述确定部确定的所述混合比率,针对每个声道混合所述多个声道的频谱;以及编码部,对经所述混合部混合之后的所述多个声道的频谱进行编码。
【技术特征摘要】
2011.07.01 JP 2011-147421;2011.10.20 JP 2011-23031.一种音频编码器,包括:确定部,基于多个声道的音频信号的频谱,确定混合比率,所述混合比率为针对所述多个声道中的每个声道,其它声道的频谱相对于该声道的混合后频谱的比率;混合部,基于所述确定部确定的所述混合比率,针对每个声道混合所述多个声道的频谱;以及编码部,对经所述混合部混合之后的所述多个声道的频谱进行编码,其中,所述确定部基于所述多个声道的频谱之间的水平比,确定所述混合比率。2.根据权利要求1所述的音频编码器,其中,所述确定部还基于所述多个声道的频谱之间的关联,确定所述混合比率。3.根据权利要求2所述的音频编码器,其中,所述确定部以下述方式确定所述混合比率:所述混合比率随着所述关联越接近0而变得越大,并且所述混合比率随着所述关联越接近-1而变得越小。4.根据权利要求2所述的音频编码器,其中,当所述关联小于预定负阈值时,所述确定部确定所述混合比率是0,其中所述预定负阈值大于-1。5.根据权利要求1所述的音频编码器,其中,所述确定部以下述方式确定所述混合比率:所述混合比率随着所述水平比越大而变得越小。6.根据权利要求1所述的音频编码器,其中,当所述多个声道中...
【专利技术属性】
技术研发人员:户栗康裕,前田祐儿,松本淳,铃木志朗,松村祐树,
申请(专利权)人:索尼公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。