从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备技术

技术编号：3044590 阅读：237 留言：0更新日期：2012-04-11 18:40

一种提取具有重要频谱分量（ＩＳＣ）的音频信号的方法和设备、以及使用该提取ＩＳＣ的方法和设备的低比特率音频信号编码／解码方法。提取ＩＳＣ的方法包括：通过使用心理模型计算包括变换的频谱音频信号的ＳＭＲ（信号掩蔽比）值的感知重要性，使用ＳＭＲ值将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为第一ＩＳＣ；根据预定权重因数从选作为ＩＳＣ的频谱音频信号提取频谱峰值以选择第二ＩＳＣ。因此，可有效地对感知重要频谱分量编码，从而获得低比特率的高声音质量。此外，通过使用心理模型能够提取感知重要频谱分量，能够无需相位信息执行编码，并且能够有效地表示低比特率的频谱信号。此外，该方法和设备可被应用到需要低比特率音频编码方案的所有应用中以及下一代音频方案中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体专利技术构思涉及一种音频信号编码和/或解码系统，更具体地讲，涉及一种提取音频信号的重要频谱分量的方法和设备以及使用其的对低比特率音频信号编码和解码的方法和设备。
技术介绍
MPEG(运动图像专家组)音频是用于高质量高性能立体声编码的 ISO/IEC标准。MPEG音频与运动图像编码根据MPEG的ISO/IEC SC29/WG11 一起被标准化。对于MPEG音频，基于32个频带的子带编码(频带分解编码) 和改进离散余弦变换(MDCT)用于压缩，具体地讲，通过使用心理特征执行高性能压缩。与传统压缩编码方案相比，MPEG音频可实现高质量的声音。为了高性能地压缩音频信号，MPEG音频利用感知编码压缩方案以减小音频信号的压缩量，在该感知编码压缩方案中，通过使用感测音频信号的人类的敏感特性来去除详细的低敏感信息。此外，在MPEG音频中，无声阶段的最小可听限制和掩蔽特性主要用于使用听觉心理特征的感知编码。无声阶段的最小可听限制是听觉可感知的声音的最小级别。最小可听限制与在无声阶段听觉可感知的噪声的限制有关。最小可听限制根据声音的频率改变。在一些频率，可听到比最小可听限制高的声音，但是在另一些频率，可能不会听到比最小可听限制低的声音。此外，特定声音的感测限制可根据与该特定声音一起听到的其他声音大大改变。这被称为掩蔽效应。发生掩蔽效应的频率的宽度被称为临界带。为了有效地利用听觉心理特征(例如，临界带)，将声音信号分解为频谱分量很重要。为此，频带被分为32个子带，随后执行子带编码。另外，在MPEG音频中，滤波器组用于消除32个子带的混叠...

【技术保护点】
一种音频信号编码和／或解码系统的方法，该方法包括：　　　　根据心理模型对变换的频谱音频信号计算包括ＳＭＲ值的感知重要性；　　　　根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ＩＳＣ；和　　　　根据预定权重因数从选作为所述一个或多个第一ＩＳＣ的频谱音频信号提取频谱峰值以选择将被用于对频谱音频信号编码的一个或多个第二ＩＳＣ。

【技术特征摘要】
【国外来华专利技术】KR 2005-7-15 10-2005-00645071、一种音频信号编码和/或解码系统的方法，该方法包括根据心理模型对变换的频谱音频信号计算包括SMR值的感知重要性；根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC；和根据预定权重因数从选作为所述一个或多个第一ISC的频谱音频信号提取频谱峰值以选择将被用于对频谱音频信号编码的一个或多个第二ISC。2、如权利要求l所述的方法，其中，提取频i普峰值作为一个或多个第二 ISC的步骤包括根据权重因数将被获得的当前信号的频率附近的预定数量的频i普值获得权重因数。3、如权利要求1所述的方法，还包括获得与频谦音频信号的频带相应的SNR;和将具有低SNR的频带中峰值大于预定值的频谱分量选作为将被用于对频谱音频信号编码的一个或多个第三ISC。4、一种音频信号编码和/或解码系统的方法，该方法包括根据心理模型对变换的频谱音频信号计算包括SMR值的感知重要性；根据计算的感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC;和获得与具有所述一个或多个第一 isc的频谱音频信号的频带相应的多个另一ISC。5、一种低比特音频信号编码方法，包括根据心理模型对频语音频信号计算包括SMR值的感知重要性；根据感知重要性将掩蔽阈值小于所述频i普音频信号的掩蔽阈值的频谱音频信号选作为一个或多个第一ISC;和根据预定权重因数从具有所述一个或多个第一 ISC的频谱音频信号提取频谱峰值，并将该频谱峰值的频率选作为一个或多个第二ISC;和根据所述一个或多个第一 ISC和第二 ISC对频谱音频信号执行量化和无损编码。6、如权利要求5所述的低比特率音频信号编码方法，其中，提取频i普峰值的步骤包括获得频语音频信号的频带的SNR，并且将具有低SNR的频带中峰值大于预定值的频谱分量选作为一个或多个第三ISC。7、如权利要求5所述的低比特率音频信号编码方法，其中，计算包括频谱音频信号的SMR值的感知重要性的步骤包括通过使用MDCT和MDST 来将时域音频信号变换为频谱音频信号，以产生频谱音频信号。8、如权利要求5所述的低比特率音频信号编码方法，其中，对频语音频信号执行量化的步骤包括根据使用的比特量和量化误差执行分组以形成多个组，从而最小化附加信息；根据SMR和所述多个组的动态范围的数据分布确定量化步长；和通过使用所述多个组的预定量化器对频谱音频信号量化。9、如权利要求8所述的低比特率音频信号编码方法，其中，对频语音频信号量化的步骤包括采用组的最大值规格化的值和量化步长确定量化器。10、如权利要求8所述的低比特率音频信号编码方法，其中，执行量化的步骤包括执行Max-LIoyd量化。11、如权利要求8所述的低比特率音频信号编码方法，其中，对量化的信号执行无损编码的步骤包括执行上下文算术编码。12、如权利要求11所述的低比特率音频信号编码方法，其中，执行上下文算术编码的步骤包括使用组成频i普音频信号的帧的频谱分量产生一个或多个频谱索引以指示第一ISC和第二ISC中的至少一个的存在；和根据与先前帧的相关性和相邻ISC的分布选择随机模型，并且对频谱音频信号的量化值以及包括量化器信息、量化步长、分组信息和频语索引值的附加信息执行无损编码。13、一种低比特率音频信号编码方法，包括根据心理模型计算包括频谱音频信号的SMR值的感知重要性；根据感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频语信号选作为一个或多个第一ISC;获得具有第一 ISC的频语音频信号的频带的SNR,并且将具有低SNR 的频带中峰值大于预定值的频谱分量选作为一个或多个另一 ISC;和对具有所述一个或多个第一 ISC和另一 ISC中的至少一个的频谱音频信号执行量化和无损编码。14、一种提取音频信号的分量的设备，包括心理建模单元，根据心理模型计算包括变换的频谱音频信号的SMR值的感知重要性；第一 ISC选择单元，根据感知重要性将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频语音频信号选作为一个或多个第一 ISC;和第二 ISC选择单元，根据预定权重因数从选作为笫一 ISC的频谱音频信号提取频谱山,值以选f奪一个或多个第二 ISC。15、如权利要求14所述的设备，其中，通过使用权重因数将被获得的当前信号的频率附近的预定数量的频谱值获得第二 ISC选择单元的权重因数。16、如权利要求14所述的设备，还包括第三ISC选择单元，获得频i普音频信号的频带的SNR，并将具有低SNR 的频带中峰值大于预定值的频镨分量选作为一个或多个第三ISC。17、一种提取音频信号的分量的设备，包括心理建模单元，根据心理模型计算包括变换的频谱音频信号的SMR值的感知重要性；第一 ISC选择单元，使用感知重要性将掩蔽阔值小于所述频谱音频信号的掩蔽阈值的频i普音频信号选作为一个或多个第一ISC;和另一 ISC选择单元，获得与具有所述一个或多个第一 ISC的频谱音频信号的频带相应的SNR，并且将具有低SNR的频带中峰值大于预定值的频谱分量选作为一个或多个另一 ISC。18、一种低比特音频信号编码设备，包括心理建模单元，根据心理模型计算包括变换的频谱音频信号的SMR值的感知重要性；第一ISC选择单元，使用SMR值将掩蔽阈值小于所述频谱音频信号的...

【专利技术属性】
技术研发人员：金重会，吴殷美，康斯坦丁奥斯波夫，波利斯库德里亚索夫，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：KR[韩国]

全部详细技术资料下载我是这个专利的主人