用于获取音频信号的替换帧的频谱系数的方法及相关产品技术

技术编号：25525493 阅读：47 留言：0更新日期：2020-09-04 17:14

描述一种获取用于音频信号的替换帧(m)的频谱系数的方法。基于存在于替换帧(m)之前的帧的频谱中的峰值，检测音频信号的频谱的音调分量。对于频谱的音调分量，预测用于替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数，且对于频谱的非音调分量，使用用于替换帧(m)的非预测频谱系数或替换帧(m)之前的帧的对应频谱系数。

全部详细技术资料下载

【技术实现步骤摘要】
用于获取音频信号的替换帧的频谱系数的方法及相关产品本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2014年6月20日、申请号为201480035489.4、专利技术名称为“用于获取音频信号的替换帧的频谱系数的方法及相关产品”的分案申请。
本专利技术涉及编码的音频信号的发送的领域，尤其涉及，一种用于获取用于音频信号的替换帧的频谱系数的方法及装置、音频解码器、音频接收器以及用于发送音频信号的系统。实施例涉及一种用于基于先前所接收的帧来建构用于替换帧的频谱的方法。
技术介绍
在已有技术中，描述了处理音频接收器处的帧丢失(frame-loss)的若干方法。举例而言，当帧在音频或语音编解码器的接收器侧丢失时，可使用如参考文献[1]中所描述的用于帧丢失隐蔽(frame-loss-concealment)的简单方法，诸如：·重复最后接收的帧，·使丢失帧静音，或·符号加扰(signscrambling)。另外，在参考文献[1]中，提出在子频带中使用预测器的先进技术。然后，将预测器技术与符号加扰结合，且使用预测增益作为逐子频带决策准则以确定对于此子频带的频谱系数将使用哪种方法。在参考文献[2]中，将时域中的波形信号外插用于MDCT(改进的离散余弦变换，ModifiedDiscreteCosineTransform)域编解码器。对于包括语音的单音信号，此类方法可能较好。若允许一个帧延迟，则可将周围帧的内插用于丢失帧的建构。在参考文献[3]中描述了此方法，其中使用索引为m-1

【技术保护点】
1.一种用于获取用于音频信号的替换帧的频谱系数的方法，所述方法包含：/n基于存在于替换帧(m)之前的帧(m-1,m-2)的频谱中的峰值(502)，检测音频信号的频谱的音调分量(S206)；/n对于频谱的所述音调分量，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数(S210)；以及/n对于频谱的非音调分量，使用用于所述替换帧(m)的非预测频谱系数或所述替换帧(m)之前的帧的对应频谱系数(S214)。/n

【技术特征摘要】
20130621 EP 13173161.4;20140505 EP 14167072.91.一种用于获取用于音频信号的替换帧的频谱系数的方法，所述方法包含：
基于存在于替换帧(m)之前的帧(m-1,m-2)的频谱中的峰值(502)，检测音频信号的频谱的音调分量(S206)；
对于频谱的所述音调分量，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数(S210)；以及
对于频谱的非音调分量，使用用于所述替换帧(m)的非预测频谱系数或所述替换帧(m)之前的帧的对应频谱系数(S214)。

2.如权利要求1所述的方法，其中：
基于所述替换帧(m)之前的帧(m-2)的复频谱的幅度和所述替换帧(m)的复频谱的预测相位，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数，且
基于所述替换帧(m)之前的帧(m-2)的复频谱的相位和在所述替换帧(m)之前的帧(m-1,m-2)之间的相移，预测所述替换帧(m)的复频谱的相位。

3.如权利要求2所述的方法，其中：
基于所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的幅度和所述替换帧(m)的复频谱的预测相位，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数，且
基于所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱，预测所述替换帧(m)的复频谱的相位。

4.如权利要求2所述的方法，其中基于用于在所述替换帧(m)之前的帧(m-2)中的峰值及其周围部分处的每个频谱系数的相位，预测所述替换帧(m)的复频谱的相位。

5.如权利要求2所述的方法，其中对于在各个帧中的峰值及其周围部分处的每个频谱系数，在所述替换帧(m)之前的帧(m-1,m-2)之间的相移是相等的。

6.如权利要求1所述的方法，其中所述音调分量由峰值及其周围部分限定。

7.如权利要求1所述的方法，其中峰值的周围部分由在峰值(502)周围的预定义数目的系数限定。

8.如权利要求1所述的方法，其中峰值的周围部分包括在峰值(502)左边的第一数目的系数和在峰值(502)右边的第二数目的系数。

9.如权利要求8所述的方法，其中所述第一数目的系数包括在左脚(508)与峰值(502)之间的系数加上所述左脚(508)的系数，且其中所述第二数目的系数包括在右脚(510)与峰值(502)之间的系数加上所述右脚(510)的系数。

10.如权利要求8所述的方法，其中在峰值(502)左边的系数的第一数目与在峰值(502)右边的系数的第二数目是相等或不等的。

11.如权利要求10所述的方法，其中在峰值(502)左边的系数的所述第一数目为三，且在峰值(502)右边的系数的所述第二数目为三。

12.如权利要求6所述的方法，其中在所述检测音调分量的步骤之前，设定在峰值(502)周围的系数的预定义数目。

13.如权利要求1所述的方法，其中峰值的周围部分的大小为适应性的。

14.如权利要求13所述的方法，其中选择峰值的周围部分，以使得在两个峰值周围的周围部分不重叠。

15.如权利要求2所述的方法，其中：
基于所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的幅度和所述替换帧(m)的复频谱的预测相位，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数，
基于所述替换帧(m)之前的最后一个帧(m-1)的复频谱的相位和在所述替换帧(m)之前的最后一个帧(m-1)与倒数第二个帧(m-2)之间的改进相移，预测所述替换帧(m)的复频谱的相位，
基于所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的幅度、所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的相位、在所述替换帧(m)之前的最后一个帧(m-1)与倒数第二个帧(m-2)之间的相移以及最后一个帧(m-1)的实频谱，确定所述替换帧(m)之前的最后一个帧(m-1)的复频谱的相位，且
基于所述替换帧(m)之前的最后一个帧(m-1)的复频谱的相位和所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的相位，确定所述改进相移。

16.如权利要求15所述的方法，其中基于连续丢失的帧的数目，相移的改进为适应性的。

17.如权利要求16所述的方法，其中从第三丢失帧开始，针对峰值确定的相移用于预测在峰值(502)周围的频谱系数。

18.如权利要求17所述的方法，其中对于预测第二丢失帧中的频谱系数，当所述替换帧(m)之前的最后一个帧(m-1)中的相移等于或低于预定义阈值时，针对峰值(502)确定的相移用于预测用于周围频谱系数的频谱系数，且当所述替换帧(m)之前的最后一个帧(m-1)中的相移高于所述预定义阈值时，针对各个周围频谱系数确定的相移用于预测用于周围频谱系数的频谱系数。

19.如权利要求2所述的方法，其中：
基于所述替换帧(m)之前的最后一个帧(m-1)的复频谱的改进幅度和所述替换帧(m)的复频谱的预测相位，预测用于所述替换帧(m)的频谱中的峰值(502)及其周围部分的频谱系数，且
基于所述替换帧(m)之前的倒数第二个帧(m-2)的复频谱的相位和在所述替换...

【专利技术属性】
技术研发人员：珍妮·苏科夫斯基，拉尔夫·斯皮尔施内德，戈兰·马尔科维奇，沃尔夫冈·耶格斯，克里斯蒂安·赫尔姆里希，贝恩德·埃德勒，拉尔夫·盖格，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人