解码装置、解码方法及程序制造方法及图纸

技术编号:5519088 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种解码装置、解码方法及计算机可读取的记录介质。该解码装置对编码数据进行解码并输出音频信号,其中,所述编码数据是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到的。该解码装置包括如下单元:对所述编码数据进行解码和逆量化,并取得所述音频信号的频域数据;根据所述编码数据算出作为所述比例值的编码数据的位数的比例位数、或作为所述频谱值的编码数据的位数的频谱位数;根据所述比例位数或所述频谱位数,估计所述频域数据的量化误差;根据所述量化误差算出校正量,并使用该校正量校正所述频域数据;以及将所述频域数据变换为所述音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及将声音及音乐等的音频信号压縮/解压縮的音频编码/解 码技术。特别涉及在将音频信号的编码数据解码时,校正量化误差的技 术。
技术介绍
作为将音频信号变换为频域的信号来进行编码的方式的一例,公知有ISO/IEC 13818-7 MPEG-2 AAC(Advanced Audio Coding)方式。AAC方式作为单波段广播或数字AV设备等的声音编码方式来采用。图1表示了采用AAC方式的编码装置1的结构例。图1所示的编码装置1具有MDCT (modified discrete cosine transform)部11、心理听觉分析部12、量化部13以及霍夫曼编码部14。在该编码装置1中,MDCT部11通过MDCT变换将输入音变换为频域数据即MDCT系数。并且,心理听觉分析部12对输入音进行心理听觉分析,并求出用于区别听觉上重要的频率和听觉上不重要的频率的掩蔽阈值。量化部13根据掩蔽阈值减少听觉上不重要的频域的数据的量化位 数,向听觉上重要的频域的数据分配多个量化位,进行频域数据的量化。 从量化部13输出作为被量化的频谱值的量化值和比例(scale)值,这些 数据被霍夫曼编码部14进行霍夫曼编码后作为编码数据从编码装置1输 出。另外,比例值是表示音频信号向频域变换后的频谱波形的倍率的数 字,相当于用浮动小数点形式表示MDCT系数时的指数部。并且,频谱 值相当于用浮动小数点形式表示MDCT系数时的尾数部,且相当于上述 频谱的波形。即、MDCT系数可以表现为频谱值x2比例值。图2表示AAC方式的解码装置2的结构例。图2所示的解码装置2具有霍夫曼解码部21、逆量化部22以及逆MDCT部23。该解码装置2 接收通过图1所示的编码装置1编码后的编码数据,并由霍夫曼解码部 21将编码数据变换为量化值和比例值。并且,逆量化部22将量化值和比 例值变换为逆量化值(MDCT系数),并由逆MDCT部23将MDCT系 数变换为时域的信号,输出解码音。另外,作为有关量化误差校正的现有技术,有下述的专利文献1 4。专利文献1:日本特开2006-60341号公报专利文献2:日本特开2001-102930号公报专利文献3:日本特开2002-290243号公报专利文献4:日本特开平11-4449号公报在通过图1所示的编码装置1中的量化部13量化MDCT系数时, 例如如图3所示发生量化误差。图3表示了量化后的MDCT系数相比于 量化前的MDCT系数变大的情形,但也存在量化后的MDCT系数相比于 量化前的MDCT系数变小的情形。通常,即使发生量化误差,对解码后的音质也没有太大影响。但是, 在输入音为大振幅(0dB附近)的情形下,在量化后的MDCT系数相比 于量化前的MDCT系数变大时,如果通过现有的解码装置2解码压縮数 据,则解码音的振幅也变大,有时解码音振幅超过PCM (Pulse Code Modulation)数据的字长(例如16bit)。此时,由于超过PCM数据的字 长的部分不能表现为数据,因此发生益出,其结果存在听到异常音(削 波音)的问题。例如,对图4所示的大振幅的输入音进行编码,而解码 后的解码音超过图5所示的PCM数据的字长时,发生削波。特别是,在低位率(高压縮)条件下,由于量化误差容易变大,因 此容易发生上述削波音。由于引起削波音的量化误差发生在编码装置侧, 因此在现有的解码装置中很难解决上述削波音的问题。
技术实现思路
本专利技术是鉴于上述问题而提出的,其目的在于提供一种在解码装置 将编码数据解码后输出音频信号时,削减由于量化误差发生的异常音的技术。为了解决上述课题,根据本专利技术的一实施方式,提供一种解码装置, 该解码装置对编码数据进行解码而输出音频信号,其中,所述编码数据 是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到 的。该解码装置包括频域数据取得单元,其对所述编码数据进行解码和逆量化,并取得所述音频信号的频域数据;位数算出单元,其根据所述编码数据算出比例位数或频谱位数,其中,该比例位数是所述比例值的编码数据的位数,该频谱位数是所述频谱值的编码数据的位数;量化 误差估计单元,其根据所述比例位数或所述频谱位数,估计所述频域数 据的量化误差;校正单元,其根据所述量化误差算出校正量,使用该校 正量校正由所述频域数据取得单元取得的所述频域数据;以及变换单元, 其将通过所述校正单元校正后的所述频域数据变换为所述音频信号。在所述解码装置中,所述位数算出单元也可以算出所述比例位数或 所述频谱位数相对于所述比例位数和所述频谱位数的合计的比例,所述 量化误差估计单元根据该比例估计所述量化误差。并且,所述量化误差估计单元也可以使用所述比例位数或所述频谱 位数与所述量化误差之间的预先确定的对应关系来估计所述量化误差。 并且所述量化误差估计单元也可以取得由所述频域数据取得单元取得的 所述频域数据,根据所述频域数据的值的大小,选择所述比例位数或所 述频谱位数与所述量化误差之间的预先确定的多个对应关系中的一个对 应关系,使用所选择的对应关系来估计所述量化误差。并且,在所述解码装置中,所述校正单元也可以取得由所述频域数 据取得单元取得的所述频域数据,根据该频域数据的值的大小,选择所 述量化误差与所述校正量之间的预先确定的多个对应关系中的一个对应 关系,使用所选择的对应关系来算出所述校正量。通过该结构,可以根 据频域数据的值的大小算出适当的校正量。并且,所述解码装置还可以包括根据所述编码数据算出位率的位率 算出单元,此时,所述量化误差估计单元也可以根据所述位率,选择所 述比例位数或所述频谱位数与所述量化误差之间的预先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来估计所述量化误差。 并且此时,所述校正单元也可以根据所述位率,选择所述量化误差与所 述校正量之间的预先确定的多个对应关系中的一个对应关系,使用所选 择的对应关系来算出所述校正量。由此,可以根据位率算出适当的校正根据本专利技术,根据由编码数据算出的比例位数或频谱位数来估计量 化误差,并使用根据该量化误差算出的校正量来校正逆量化数据,因此 在解码装置将编码数据解码后输出音频信号时,削减由于量化误差发生 的异常音。附图说明图1是表示现有的编码装置的结构例的图。图2是表示现有的解码装置的结构例的图。图3是用于说明量化误差的图。图4是表示输入音的例子的图。图5是表示对应于图4所示的输入音的解码音的图。图6是表示本专利技术实施方式的解码装置的基本结构的图。图7是用于说明频谱位数和比例位数的关系的图。图8是表示MDCT系数的校正的图。图9是本专利技术第1实施方式的解码装置的结构图。图IO是用于说明第1实施方式的解码装置的动作的流程图。图IIA是表示频谱值的霍夫曼码本的例子的图。图11B是表示比例值的霍夫曼码本的例子的图。图12是表示比例位数和量化误差的对应关系的例子的图。图13是表示频谱位数和量化误差的对应关系的例子的图。图14是表示比例位数和量化误差的对应关系的例子的图。图15是表示频谱位数和量化误差的对应关系的例子的图。图16是表示量化误差和校正量之间的对应关系的例子的图。图17是表示第2实施方式的解码装置的结构的图。图18是表示准备多个比例位数和量化误差之间的对应关系时的例本文档来自技高网
...

【技术保护点】
一种解码装置,该解码装置对编码数据进行解码并输出音频信号,其中,所述编码数据是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到的,该解码装置的特征在于,所述解码装置包括:    频域数据取得单元,其对所述编码数据进行解码和逆量化,取得所述音频信号的频域数据;    位数算出单元,其根据所述编码数据算出比例位数或频谱位数,其中,该比例位数是所述比例值的编码数据的位数,该频谱位数是所述频谱值的编码数据的位数;    量化误差估计单元,其根据所述比例位数或所述频谱位数,估计所述频域数据的量化误差;    校正单元,其根据所述量化误差算出校正量,使用该校正量校正由所述频域数据取得单元取得的所述频域数据;以及    变换单元,其将通过所述校正单元校正后的所述频域数据变换为所述音频信号。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:铃木政直田中正清白川美由纪土永义照
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1