从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备技术

技术编号:3044590 阅读:237 留言:0更新日期:2012-04-11 18:40
一种提取具有重要频谱分量(ISC)的音频信号的方法和设备、以及使用该提取ISC的方法和设备的低比特率音频信号编码/解码方法。提取ISC的方法包括:通过使用心理模型计算包括变换的频谱音频信号的SMR(信号掩蔽比)值的感知重要性,使用SMR值将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为第一ISC;根据预定权重因数从选作为ISC的频谱音频信号提取频谱峰值以选择第二ISC。因此,可有效地对感知重要频谱分量编码,从而获得低比特率的高声音质量。此外,通过使用心理模型能够提取感知重要频谱分量,能够无需相位信息执行编码,并且能够有效地表示低比特率的频谱信号。此外,该方法和设备可被应用到需要低比特率音频编码方案的所有应用中以及下一代音频方案中。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体专利技术构思涉及一种音频信号编码和/或解码系统,更具体地 讲,涉及一种提取音频信号的重要频谱分量的方法和设备以及使用其的对低 比特率音频信号编码和解码的方法和设备。
技术介绍
MPEG(运动图像专家组)音频是用于高质量高性能立体声编码的 ISO/IEC标准。MPEG音频与运动图像编码根据MPEG的ISO/IEC SC29/WG11 一起被标准化。对于MPEG音频,基于32个频带的子带编码(频带分解编码) 和改进离散余弦变换(MDCT)用于压缩,具体地讲,通过使用心理特征执行高 性能压缩。与传统压缩编码方案相比,MPEG音频可实现高质量的声音。为了高性能地压缩音频信号,MPEG音频利用感知编码压缩方案以 减小音频信号的压缩量,在该感知编码压缩方案中,通过使用感测音频 信号的人类的敏感特性来去除详细的低敏感信息。此外,在MPEG音频中,无声阶段的最小可听限制和掩蔽特性主要用于 使用听觉心理特征的感知编码。无声阶段的最小可听限制是听觉可感知的声 音的最小级别。最小可听限制与在无声阶段听觉可感知的噪声的限制有关。 最小可听限制根据声音的频率改变。在一些频率,可听到比最小可听限制高 的声音,但是在另一些频率,可能不会听到比最小可听限制低的声音。此外, 特定声音的感测限制可根据与该特定声音一起听到的其他声音大大改变。这 被称为掩蔽效应。发生掩蔽效应的频率的宽度被称为临界带。为了有效地 利用听觉心理特征(例如,临界带),将声音信号分解为频谱分量很重要。为此, 频带被分为32个子带,随后执行子带编码。另外,在MPEG音频中,滤波器组用于消除32个子带的混叠噪声。
技术实现思路
技术问题MPEG音频包括使用滤波器组和心理模型的比特分配和量化。通过 MDCT产生的系数分配有最佳量化比特,并且通过使用心理模型2被压缩。 用于分配最佳比特的心理模型2通过使用扩散函数基于FFT来估计掩蔽效 应。因此,需要相对大量的复杂度。通常,对于低比特率(32kbps或更少)音频信号的压缩,可分配给信号的 比特数不足以量化音频信号的所有频谱分量及其无损编码。因此,需要提取 感知的重要频谱分量(ISC)和量化及其无损编码。技术方案本专利技术总体专利技术构思提供一种从音频信号提取重要频谱分量以低比特率 压缩音频信号的方法和设备。本专利技术总体专利技术构思还提供一种使用从音频信号提取重要频谱分量的方 法和设备的低比特率音频信号编码方法和设备。本专利技术总体专利技术构思还提供一种对通过低比特率音频信号编码方法和设 备编码的低比特率音频信号解码的低比特音频信号解码方法和设备。将在接下来的描述中部分阐述本专利技术另外的方面和优点,还有一部分通 过描述将是清楚的,或者可以经过本专利技术总体专利技术构思的实施而得知。可通过提供一种提取音频信号的重要频谱分量(ISC)的方法来实现本发 明总体专利技术构思的前述和/或其他方面和优点,该方法包括通过使用心理模 型计算包括变换的频谱音频信号的信号掩蔽比(SMR)值的感知重要性,使用 SMR值将掩蔽阈值小于所述频语音频信号的掩蔽阈值的频谱音频信号选作 为第一 ISC;根据预定权重因数从选作为第一 ISC的频谱音频信号提取频谱 峰值以选择第二 ISC。可通过使用权重因数将被获得的当前信号的频率附近 的预定数量的频谱值获得权重因数。该方法还可包括获得频带的SNR(信噪比);和将具有低SNR的频带中峰 值大于预定值的频语分量选作为ISC。还可通过提供一种提取音频信号的重要频i普分量(ISC)的方法来实现本专利技术总体专利技术构思的前述和/或其他方面和优点,该方法包括通过使用心理模型计算包括变换的频谱音频信号的SMR(信号掩蔽比)值的感知重要性;使 用SMR将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作 为第一 ISC;和获得选作为第一 ISC的频谱音频信号中的频带的SNR以将具 有低SNR的频带中峰值大于预定值的频语分量的频镨音频信号选作为另一 ISC。还可通过提供一种低比特率音频信号编码方法来实现本专利技术总体专利技术构思的前述和/或其他方面和优点,该方法包括通过使用心理模型计算包括频 语音频信号的SMR(信号掩蔽比)值的感知重要性;使用SMR值将掩蔽阈值小 于所述频i普音频信号的掩蔽阈值的频镨音频信号选作为第一 ISC;和根据预 定权重因数从选作为第一ISC的频谱音频信号提取频谱峰值,并将具有该频 语峰值的频率的频谱音频信号选作为第二 ISC;和对具有第二 ISC的频谱音 频信号执行量化和无损编码。提取频语峰值的步骤可包括获得频带的 SNR(信噪比),并且通过使用SNR将具有低SNR的频带中峰值大于预定值的 频谱分量选作为第三ISC。低比特率音频信号编码方法还可包括通过使用 MDCT(改进离散余弦变换)和MDST(改进离散正弦变换)来将时域音频信号变 换为频i普音频信号以产生频谱音频信号。对ISC音频信号执行量化的步骤可 包括根据使用的比特量和量化误差将音频信号分成多个组以最小化附加信 息;根据SMR(信号掩蔽比)和所述多组的动态范围的数据分布确定量化步长; 和通过使用所述多组的一个或多个预定量化器对音频信号量化。可通过使用 采用组的最大值规格化的值和量化步长确定量化器。量化可以是Max-Lloyd 量化。对量化的信号执行无损编码的步骤可包括上下文算术编码。执行上下 文算术编码的步骤可包括采用指示ISC的存在的频语索引表示组成帧的频 谱分量;和根据与先前帧的相关性和相邻ISC的分布选择随机模型,以对音 频信号的量化值以及包括量化器信息、量化步骤、分组信息和频镨索引值的 附加信息执行无损编码。还可通过提供一种低比特率音频信号编码方法来实现本专利技术总体专利技术构 思的前述和/或其他方面和优点,该方法包括通过使用心理^t型计算包括频 谱音频信号的SMR(信号掩蔽比)值的感知重要性;使用SMR值将掩蔽阈值小 于所述频i普音频信号的掩蔽阈值的频谱信号选作为第一 ISC;获得选作为第一 ISC的频语音频信号中的频带的SNR,并且使用SNR将具有低SNR的频 带中峰值大于预定值的频谱分量选作为另一ISC;和对于具有另一ISC的频 语音频信号执行量化和无损编码。还可通过提供一种提取音频信号ISC(重要频镨分量)的设备来实现本发 明总体专利技术构思的前述和/或其他方面和优点,该设备包括心理建模单元, 通过使用心理模型计算包括变换的频谱音频信号的SMR(信号掩蔽比)值的感 知重要性;第一ISC选择单元,使用SMR将掩蔽阈值小于所述频谱音频信号 的掩蔽阈值的频谱音频信号选作为第一ISC;和第二ISC选择单元,根据预 定权重因数从选作为第一 ISC的频语音频信号提取频谱峰值并选择第二 ISC。 可通过使用权重因数将被获得的当前信号的频率附近的预定数量的频谱值获 得第二ISC选择单元的权重因数。该设备还可包括第三ISC选择单元,获 得频带的SNR(信噪比),并通过使用SNR将具有低SNR的频带中峰值大于 预定值的频语分量选作为第三ISC。还可通过提供一种提取音频信号ISC(重要频谱分量)的设备来实现本发 明总体专利技术构思的前述和/或其他方面和优点,该设备包括心理建模单元, 通过使用心理模型计算包括变换的频谱音频信号的SMR(信号掩蔽比)值的感 知重要性;第一ISC选择单元,使用SM本文档来自技高网
...

【技术保护点】
一种音频信号编码和/或解码系统的方法,该方法包括:    根据心理模型对变换的频谱音频信号计算包括SMR值的感知重要性;    根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC;和    根据预定权重因数从选作为所述一个或多个第一ISC的频谱音频信号提取频谱峰值以选择将被用于对频谱音频信号编码的一个或多个第二ISC。

【技术特征摘要】
【国外来华专利技术】KR 2005-7-15 10-2005-00645071、一种音频信号编码和/或解码系统的方法,该方法包括根据心理模型对变换的频谱音频信号计算包括SMR值的感知重要性;根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC;和根据预定权重因数从选作为所述一个或多个第一ISC的频谱音频信号提取频谱峰值以选择将被用于对频谱音频信号编码的一个或多个第二ISC。2、 如权利要求l所述的方法,其中,提取频i普峰值作为一个或多个第二 ISC的步骤包括根据权重因数将被获得的当前信号的频率附近的预定数量 的频i普值获得权重因数。3、 如权利要求1所述的方法,还包括 获得与频谦音频信号的频带相应的SNR;和将具有低SNR的频带中峰值大于预定值的频谱分量选作为将被用于对 频谱音频信号编码的一个或多个第三ISC。4、 一种音频信号编码和/或解码系统的方法,该方法包括 根据心理模型对变换的频谱音频信号计算包括SMR值的感知重要性; 根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC;和获得与具有所述一个或多个第一 isc的频谱音频信号的频带相应的多个另一ISC。5、 一种低比特音频信号编码方法,包括根据心理模型对频语音频信号计算包括SMR值的感知重要性;根据感知重要性将掩蔽阈值小于所述频i普音频信号的掩蔽阈值的频谱音 频信号选作为一个或多个第一ISC;和根据预定权重因数从具有所述一个或多个第一 ISC的频谱音频信号提取 频谱峰值,并将该频谱峰值的频率选作为一个或多个第二ISC;和根据所述一个或多个第一 ISC和第二 ISC对频谱音频信号执行量化和无 损编码。6、 如权利要求5所述的低比特率音频信号编码方法,其中,提取频i普峰值的步骤包括获得频语音频信号的频带的SNR,并且将具有低SNR的频带 中峰值大于预定值的频谱分量选作为一个或多个第三ISC。7、 如权利要求5所述的低比特率音频信号编码方法,其中,计算包括频 谱音频信号的SMR值的感知重要性的步骤包括通过使用MDCT和MDST 来将时域音频信号变换为频谱音频信号,以产生频谱音频信号。8、 如权利要求5所述的低比特率音频信号编码方法,其中,对频语音频 信号执行量化的步骤包括根据使用的比特量和量化误差执行分组以形成多个组,从而最小化附加 信息;根据SMR和所述多个组的动态范围的数据分布确定量化步长;和 通过使用所述多个组的预定量化器对频谱音频信号量化。9、 如权利要求8所述的低比特率音频信号编码方法,其中,对频语音频 信号量化的步骤包括采用组的最大值规格化的值和量化步长确定量化器。10、 如权利要求8所述的低比特率音频信号编码方法,其中,执行量化 的步骤包括执行Max-LIoyd量化。11、 如权利要求8所述的低比特率音频信号编码方法,其中,对量化的 信号执行无损编码的步骤包括执行上下文算术编码。12、 如权利要求11所述的低比特率音频信号编码方法,其中,执行上下 文算术编码的步骤包括使用组成频i普音频信号的帧的频谱分量产生一个或多个频谱索引以指示 第一ISC和第二ISC中的至少一个的存在;和根据与先前帧的相关性和相邻ISC的分布选择随机模型,并且对频谱音 频信号的量化值以及包括量化器信息、量化步长、分组信息和频语索引值的 附加信息执行无损编码。13、 一种低比特率音频信号编码方法,包括根据心理模型计算包括频谱音频信号的SMR值的感知重要性; 根据感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频语信号选作为一个或多个第一ISC;获得具有第一 ISC的频语音频信号的频带的SNR,并且将具有低SNR 的频带中峰值大于预定值的频谱分量选作为 一个或多个另一 ISC;和对具有所述一个或多个第一 ISC和另一 ISC中的至少一个的频谱音频信号执行量化和无损编码。14、 一种提取音频信号的分量的设备,包括心理建模单元,根据心理模型计算包括变换的频谱音频信号的SMR值 的感知重要性;第一 ISC选择单元,根据感知重要性将掩蔽阈值小于所述频谱音频信号 的掩蔽阈值的频语音频信号选作为一个或多个第一 ISC;和第二 ISC选择单元,根据预定权重因数从选作为笫一 ISC的频谱音频信 号提取频谱山,值以选f奪一个或多个第二 ISC。15、 如权利要求14所述的设备,其中,通过使用权重因数将被获得的当 前信号的频率附近的预定数量的频谱值获得第二 ISC选择单元的权重因数。16、 如权利要求14所述的设备,还包括第三ISC选择单元,获得频i普音频信号的频带的SNR,并将具有低SNR 的频带中峰值大于预定值的频镨分量选作为一个或多个第三ISC。17、 一种提取音频信号的分量的设备,包括心理建模单元,根据心理模型计算包括变换的频谱音频信号的SMR值 的感知重要性;第一 ISC选择单元,使用感知重要性将掩蔽阔值小于所述频谱音频信号 的掩蔽阈值的频i普音频信号选作为一个或多个第一ISC;和另一 ISC选择单元,获得与具有所述一个或多个第一 ISC的频谱音频信 号的频带相应的SNR,并且将具有低SNR的频带中峰值大于预定值的频谱分 量选作为一个或多个另一 ISC。18、 一种低比特音频信号编码设备,包括心理建模单元,根据心理模型计算包括变换的频谱音频信号的SMR值 的感知重要性;第一ISC选择单元,使用SMR值将掩蔽阈值小于所述频谱音频信号的...

【专利技术属性】
技术研发人员:金重会吴殷美康斯坦丁奥斯波夫波利斯库德里亚索夫
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1