音频编码装置、方法和程序以及音频解码装置、方法和程序制造方法及图纸

技术编号:8983407 阅读:145 留言:0更新日期:2013-08-01 02:14
对由多个帧构成的音频信号进行编码的编码部具有:音频编码部,其对音频信号进行编码;以及辅助信息编码部,其估计辅助信息并进行编码,该辅助信息被用于解码音频信号时的分组丢失的掩藏,并与音频信号的功率的时间变化相关。在与上述功率的时间变化相关的辅助信息中,可以包含有对多个比1帧短的子帧的功率进行函数近似而得到的参数,还可以包含有与对多个比1帧短的子帧的功率进行矢量量化而得到的矢量相关的信息。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及经由IP网和移动通信网传输包含对由多个帧构成的音频信号进行编码而得到的音频码的音频分组时的错误掩藏,更具体而言,涉及用于实现错误掩藏的音频编码装置、音频编码方法和音频编码程序以及音频解码装置、音频解码方法和音频解码程序。
技术介绍
在IP网和移动通信中传输音频/声音信号(以下称作“音频信号”)时,对音频信号进行编码而以较小的比特数来表现并分割为音频分组,经由通信网传输该音频分组。通过通信网接收到的音频分组在接收侧的服务器、MCU、终端等中被解码,从而得到解码音频信号。在通过通信网传输音频分组时,由于通信网的拥挤状态等,可能会产生丢失一部分音频分组或在写入到音频分组中的一部分信息中产生错误的现象(所谓的分组丢失)。在这种情况下,无法在接收侧对音频分组进行正确解码,因此不能得到期望的解码音频信号。此外,由于与产生分组丢失的音频分组对应的解码音频信号被感知为噪音,因此显著损坏对收听的人赋予的主观品质。 为了消除上述那样的不良情况,存在“接收侧中的掩藏技术”和“发送侧中的掩藏技术”,作为对由于分组丢失而丢失的部分的音频声音信号进行插值的分组丢失掩藏技术。在其中的“接收侧中的掩藏技术”中,例如非专利文献I的技术那样,通过在以音调(pitch)为单位复制了之前正常接收到的分组所包含的解码音频信号后,乘以预先确定的衰减系数,生成与分组丢失的部分对应的音频信号。但是,“接收侧中的掩藏技术”以分组丢失的部分的音频性质与分组丢失紧之前的音频相似为前提,因此在分组丢失的部分与丢失紧之前的音频具有不同性质的情况、和功率急剧变化的情况下不能充分发挥掩藏效果。此外,在“接收侧中的掩藏技术”中存在专利文献I的技术作为更高级的技术。在该专利文献I的技术中,复制之前正常接收到的分组所包含的解码音频来生成掩藏信号,但以下方法与上述非专利文献I的技术不同:通过乘以根据复制源的音频性质(功率谱的形状)而发生变化的衰减系数,进行异常声音少且高音质的掩藏信号的整形。另一方面,存在专利文献2的技术和专利文献3的技术作为“发送侧中的掩藏技术”。在其中的专利文献2的技术中,将之前正常接收到的分组所包含的音频信号蓄积到缓冲器中,并且将表示在丢失分组时从缓冲器的哪个位置复制音频信号的位置信息编码为辅助信息并进行传输。并 且 ,除了位置信息以外,还在辅助信息中包含表示分组丢失部分是否为无声区间这样的振幅信息,由此防止在产生了分组丢失的部分本来是无声区间的情况下混入不必要的声音的情况。此外,在专利文献3的技术中,解码装置具有:掩藏分组丢失的第一掩藏装置;根据辅助信息修正第一掩藏装置输出的第一掩藏信号的第二掩藏装置;以及对辅助信息进行解码的辅助信息解码装置。在第一掩藏装置中不能充分发挥掩藏效果的情况下,第二掩藏装置使用辅助信息解码装置生成的辅助信息来修正第一掩藏信号,生成第二掩藏信号。作为辅助信息,利用功率谱包络、根据相邻的帧的功率谱包络预测的值和对输入功率谱包络的误差进行编码得到的值。第二掩藏装置在具有能够用作辅助信息的功率谱包络的频域中对第一掩藏信号乘以增益,生成比第一掩藏信号精度更高的第二掩藏信号。现有技术文献专利文献专利文献1:日本再公表特许W02007/000988号公报专利文献2:日本特开2003 - 316670号公报专利文献3:日本特开2008 - 111991号公报非专利文献非专利文献1:1TU — TG.71 IAppendixI
技术实现思路
专利技术所要解决的课题但是,专利文献I的技术是根据之前正常接收到的解码信号,通过预测生成掩藏信号的方法,因此难以根据之前的信号高精度地生成例如响板的拍打声那样具有与预测结果偏离较大的功率变化的掩藏信号。此外,专利文献2的技术在发送侧生成与无声区间相关的振幅信息,防止在分组丢失的部分为无声区间的情况下生成掩藏信号,但对于上述的响板的拍打声那样的伴随突发的功率变化的声音不具有足够的掩藏效果。此外,专利文献3的技术是在以帧为单位进行时频变换后进行频域中的处理的方法,因此处理的单位是帧单位,难以处理帧内的急剧的功率变化。此外,以之前的信号和分组丢失的信号的相关性高为前提对分组丢失部分的解码音频进行高精度化,因此在功率急剧变化的部分产生分组丢失的情况下,信号的相关性变低,因此功率谱包络的预测误差变大,所以难以利用较少的比特数来进行编码,难以生成高精度的解码音频。如上所述,在现有技术中,具有如下问题:对拍手和响板的拍打声那样的伴随有在时间上较快的功率变化的信号(以下称作“瞬态信号”)不具有足够的错误掩藏效果。即,在接收侧,要根据通过解码由紧之前正常接收到的音频分组而得到的解码信号,正确预测在音频信号中的哪个时刻产生瞬态信号是极为困难的。本专利技术的目的在于解决上述问题,给出能够高精度地掩藏难以根据前后信号来预测的瞬态信号中的分组丢失的错误掩藏技术。用于解决课题的手段本专利技术的一个方面涉及音频解码,能够包含以下的音频解码装置、音频解码方法和音频解码程序。本专利技术的一个方面的音频解码装置根据包含音频码和辅助信息码的音频分组对音频码进行解码,所述辅助信息码被用于解码音频码时的分组丢失的掩藏,并与音频信号的功率的时间变化相关,该音频解码装置的特征在于,具有:错误/丢失检测部,其检测音频分组中的分组错误或分组丢失,并输出表示检测结果的错误标志;音频解码部,其对音频分组所包含的音频码进行解码来求出解码信号;辅助信息解码部,其对音频分组所包含的辅助信息码进行解码来求出辅助信息;第一掩藏信号生成部,其在所述错误标志表示音频分组的异常的情况下,根据已经求出的解码信号,生成用于掩藏分组丢失的第一掩藏信号;以及掩藏信号修正部,其根据所述辅助信息,修正第一掩藏信号。本专利技术的一个方面的音频解码方法由音频解码装置执行,该音频解码装置根据包含音频码和辅助信息码的音频分组对音频码进行解码,所述辅助信息码被用于解码音频码时的分组丢失的掩藏,并与音频信号的功率的时间变化相关,该音频解码方法的特征在于,具有:错误/丢失检测步骤,检测音频分组中的分组错误或分组丢失,并输出表示检测结果的错误标志;音频解码步骤,对音频分组所包含的音频码进行解码来求出解码信号;辅助信息解码步骤,对音频分组所包含的辅助信息码进行解码来求出辅助信息;第一掩藏信号生成步骤,在所述错误标志表示音频分组的异常的情况下,根据已经求出的解码信号,生成用于掩藏分组丢失的第一掩藏信号;以及掩藏信号修正步骤,根据所述辅助信息,修正第一掩藏信号。本专利技术的一个方面的音频解码程序的特征在于,使计算机作为如下各部发挥功能:错误/丢失检测部,其检测包含音频码和辅助信息码的音频分组中的分组错误或分组丢失,并输出表示检测结果的错误标志,所述辅助信息码被用于解码音频码时的分组丢失的掩藏,并与音频信号的功率的时间变化相关;音频解码部,其对音频分组所包含的音频码进行解码来求出解码信号;辅助信息解码部,其对音频分组所包含的辅助信息码进行解码来求出辅助信息; 第一掩藏信号生成部,其在所述错误标志表示音频分组的异常的情况下,根据已经求出的解码信号,生成用于掩藏分组丢失的第一掩藏信号;以及掩藏信号修正部,其根据所述辅助信息,修正第一掩藏信号。在一个实施方式中,可以在与功率的时间变化相关的辅助信息码中,包含有对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:堤公孝菊入圭
申请(专利权)人:株式会社NTT都科摩
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1