音频编码装置制造方法及图纸

技术编号:16400138 阅读:207 留言:0更新日期:2017-10-17 20:11
本发明专利技术提供一种音频编码装置,其具有:音频编码部,其对音频信号进行编码;以及辅助信息编码部,其计算码激励线性预测编码中的先行信号的参数,作为码激励线性预测编码中的分组丢失隐藏用的辅助信息,所述音频编码部计算表示编号对象帧的性质的索引,并将其传送给所述辅助信息编码部,仅在特定的帧类中,在作为解码对象的分组的前一个分组中包含基音滞后作为所述辅助信息,在所述特定的帧类以外的情况下,不包含基音滞后。

Audio coding device

The invention provides an audio encoding device, audio encoding, with its encoding of audio signal; and the auxiliary information encoding, the calculation code excited linear prediction in the first signal encoding parameters, as the auxiliary information code excited linear prediction encoding packet loss in hidden in the audio encoding. The Ministry said the number of object properties calculation of frame index, and transmits it to the auxiliary information encoding, only in a specific frame class, including pitch lag as the auxiliary information in a packet packet as the decoding objects, in the specific frame class outside of the case. Does not contain a pitch lag.

【技术实现步骤摘要】
音频编码装置本申请是申请号为201380058010.4的专利技术专利申请(国际申请号:PCT/JP2013/080589,申请日:2013年11月12日,专利技术名称:音频编码装置、音频编码方法和音频编码程序以及音频解码装置、音频解码方法和音频解码程序)的分案申请。
本专利技术涉及经由IP网和移动通信网传输音频分组时的错误隐藏隐藏,更具体而言,涉及实现错误隐藏的高精度分组丢失隐藏信号(パケットロス隠蔽信号)生成用的音频编码装置。
技术介绍
在IP网和移动通信中传输音频/声音信号(以下称作“音频信号”)时,按照某固定时间长度对音频信号进行编码而生成音频分组,经由通信网进行传输。在接收侧通过通信网接收音频分组,并在接收侧的服务器、MCU(MultipointControlUnit)、终端等中进行解码,从而得到解码音频信号。音频信号通常以数字形式被收音。即,作为与每一秒钟的采样频率相同数量的数列进行计测和蓄积。将该数列的各个要素称为采样(sample)。在音频编码中,每当所确定的采样数量的音频信号在内置的缓存器中蓄积了预定量时,就对缓存器内的音频信号进行编码。将所述规定的采样数量称为帧长,将与帧长相同数量的采样的集合称为帧。例如,当在32kHz的采样频率中将帧长设为20ms时,帧长为640个采样。另外,缓存器的长度也可以比1帧长。在通过通信网传输音频分组时,由于通信网的拥挤状态等,可能会产生一部分音频分组丢失或写入音频分组中的一部分信息产生错误的现象(所谓的分组丢失)。在这种情况下,由于无法在接收侧对音频分组进行正确解码,因此不能得到期望的解码音频信号。此外,由于与产生分组丢失的音频分组对应的解码音频信号被感知为噪音,因此显著损坏对收听的人提供的主观品质。为了消除上述那样的不良情况,作为对由于分组丢失而丢失的部分的音频声音信号进行插值的技术,采用分组丢失隐藏技术。分组丢失隐藏技术包括仅在接收侧进行分组丢失隐藏的“不使用辅助信息的分组丢失隐藏技术”,以及在发送侧求出有助于分组丢失隐藏的参数并传输给接收侧,然后在接收侧利用接收到的参数进行丢失隐藏的“使用辅助信息的分组丢失隐藏技术”。在其中的“不使用辅助信息的分组丢失隐藏技术”中,例如非专利文献1的技术那样,通过以基音(pitch)为单位对之前正常接收到的分组所包含的解码音频信号进行复制后,乘以预先确定的衰减系数,生成与分组丢失的部分对应的音频信号。“不使用辅助信息的分组丢失隐藏技术”以分组丢失了的部分的音频性质与即将分组丢失时的音频相似为前提,因此在分组丢失了的部分具有与即将丢失时的音频不同性质的情况、和功率急剧变化的情况下不能充分发挥隐藏效果。另一方面,在“使用辅助信息的分组丢失隐藏技术”中有如专利文献1的技术,在发送侧对分组丢失隐藏所需要的参数进行编码并传输,并在接收侧的分组丢失隐藏中使用。在专利文献1中,采用主要编码/冗余编码这两种编码方式对音频进行编码。冗余编码是以低于主要编码的比特速率对即将进行主要编码的帧的前一个帧进行编码(参照图1(a))。例如,在第N个分组中包含采用主要编码对第N帧进行编码而得到的音频码、和采用冗余编码对第N-1帧进行编码而得到的辅助信息码来进行传输。在接收侧,等待在时间上连续的两个以上分组的到达,然后对时间上较早的分组进行解码,从而得到解码音频信号。例如,在得到与第N帧对应的信号的情况下,等待第N+1分组到达后进行解码。在正常接收到第N分组、第N+1分组的情况下,对第N分组所包含的音频码进行解码,从而得到第N帧的音频信号(参照图1(b))。另一方面,在分组丢失的情况下(在第N分组丢失的状况下得到了第N+1分组的情况),对第N+1分组所包含的辅助信息码进行解码,从而得到第N帧的音频信号(参照图1(c))。在专利文献1的方法中,即使作为解码对象的分组到达了,在又一个以上的分组到达之前,也必须等待解码,算法延迟增加了1个分组量以上。因此,在专利文献1的方法中,虽然能够期待通过分组丢失隐藏来提高音质,但是算法延迟增加,音频通话质量下降。另外,在将如上所述的分组丢失技术适用于CELP(CodeExcitedLinearPrediction,码激励线性预测)编码时,由于CELP的动作特点而产生其它问题。CELP是基于线性预测的音频模型,能够高精度且以较高的压缩率对音频信号进行编码,因而在许多的国际标准中被采用。在CELP中,通过利用全极型合成滤波器对激励信号e(n)进行滤波来实现合成。即,按照下式将音频信号s(n)合成。[数式1]a(i)表示线性预测系数(LP系数),次数例如采用P=16等值。激励信号被蓄积在被称为自适应码本的缓存器中。在将新的帧的音频合成时,根据被称为基音滞后(pitchlag)的位置信息,将从自适应码本读出的自适应码本向量、和表示激励信号的时间变化的固定码本向量相加,由此生成新的激励信号。所生成的新的激励信号被蓄积在自适应码本中,同时通过全极型合成滤波器被实施滤波,从而合成解码信号。在CELP中,对所有的帧计算LP系数。在计算LP系数时需要约10ms的先行信号(先読み信号)。即,除编码对象帧以外,在缓存器中还蓄积先行信号,然后实施LP系数计算及其之后的处理(参照图2)。各帧被分割成约4个子帧,按照子帧为单位进行上述基音滞后计算、自适应码本向量计算、固定码本向量计算、自适应码本更新等的处理。在上述子帧为单位的处理中,LP系数也通过进行插值处理而变为因每个子帧而不同的系数。并且,为了便于进行量化/插值处理,LP系数在被变换为LP系数的等效表述即ISP(ImmittanceSpectralPair)参数、ISF(ImmittanceSpectralFrequency)参数的基础上进行编码。有关LP系数和ISP参数/ISF参数的相互变换的处理步骤记述在非专利文献2中。在CELP编码中,以编码侧和解码侧分别具有自适应码本、并且这些自适应码本始终同步为前提进行编码/解码。在正常接收分组并正常进行解码的情况下,编码侧的自适应码本和解码侧的自适应码本同步,但是在产生一次分组丢失时,将无法获取自适应码本的同步。例如,如果被用作基音滞后的值在编码侧和解码侧不同,则自适应码本向量成为在时间上错开的信号。由于用该自适应码本向量进行自适应码本的更新,因而即使是正常接收到下一个帧,在编码侧求出的自适应码本向量和在解码侧求出的自适应码本向量也不一致,不能恢复自适应码本的同步。由于这样的自适应码本的不一致,从分组丢失的帧开始连续数帧产生音质劣化。在CELP编码的分组丢失隐藏中,作为更高超的技术有专利文献2的方法。在专利文献2中,在分组丢失造成的影响较大的特定的帧中,传输转移模式码本的索引来取代基音滞后和自适应码本增益。在专利文献2中,作为分组丢失造成的影响较大的帧,着眼于转移帧(从无声音的音频区段(segment)向有声音的音频区段的转移,或者两个母音之间的转移)。在该转移帧中,通过使用转移模式码本进行激励信号生成,能够生成不依赖于过去的自适应码本的激励信号,并从过去的分组丢失导致的自适应码本不一致中恢复。专利文献2的方法例如在偏长的母音持续的帧等中,由于不采用转移帧码本,因而与以往一样不能从自适应码本不一致中恢复。另外,在丢失了包含转移模式本文档来自技高网...
音频编码装置

【技术保护点】
一种对音频信号进行编码的音频编码装置,该音频编码装置具有:音频编码部,其对音频信号进行编码;以及辅助信息编码部,其计算码激励线性预测编码中的先行信号的参数,作为码激励线性预测编码中的分组丢失隐藏用的辅助信息,所述音频编码部计算表示编号对象帧的性质的索引,并传送给所述辅助信息编码部,仅在特定的帧类中,在作为解码对象的分组的前一个分组中包含基音滞后作为所述辅助信息,在所述特定的帧类以外的情况下,不包含基音滞后。

【技术特征摘要】
2012.11.15 JP JP2012-2516461.一种对音频信号进行编码的音频编码装置,该音频编码装置具有:音频编码部,其对音频信号进行编码;以及辅助信息编码部,其计算码激励线性预测编码中的先行信号...

【专利技术属性】
技术研发人员:堤公孝菊入圭山口贵史
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1