根据MDCT系数的频谱形状估计制造技术

技术编号:30224713 阅读:47 留言:0更新日期:2021-09-29 09:46
提供用于控制丢失音频帧的隐藏方法的方法、解码器和程序代码。对所接收的音频信号的第一音频帧和第二音频帧解码,以获得经修正的离散余弦变换(MDCT)系数。基于根据所解码的第一音频帧的所解码的MDCT系数确定第一频谱形状的值,并且基于根据所解码的第二音频帧的所解码的MDCT系数确定第二频谱形状的值,频谱形状各自包括多个子频带。将频谱形状和第一音频帧的值和第二音频帧的帧能量变换为基于FFT的频谱分析的表示。基于FFT的表示来检测瞬态状况。响应于检测到瞬态状况,通过选择性地调整替代帧频谱的频谱幅度来修改隐藏方法。替代帧频谱的频谱幅度来修改隐藏方法。替代帧频谱的频谱幅度来修改隐藏方法。

【技术实现步骤摘要】
【国外来华专利技术】根据MDCT系数的频谱形状估计


[0001]本专利技术一般涉及隐藏与所接收的音频信号相关联的丢失音频帧的方法。本专利技术还涉及配置成隐藏与所接收的编码音频信号相关联的丢失音频帧的解码器。

技术介绍

[0002]通过现代通信信道/网络传输语音/音频主要是在数字域中使用语音/音频编解码器进行的。这可能涉及:采取模拟信号,并使用采样和模拟到数字转换器(ADC)对其进行数字化以获得数字样本。取决于应用,可进一步将这些数字样本分组为包含来自10

40ms的连续时段的样本的帧。接着,可使用压缩算法来处理这些帧,这减少需要传送的位的数量,并且这仍然可以达到尽可能高的质量。然后,作为数据分组通过数字网络将编码位流传送到接收器。在接收器中,过程是相反的。首先,可以对数据分组进行解码,以便利用数字样本再创建帧,所述帧然后可被输入到数字到模拟转换器(DAC),以便在接收器处再创建输入模拟信号的近似。图1提供了使用音频编码器和解码器通过网络(诸如数字网络)使用上述方法进行音频传输的框图的示例。
[0003]当通过网络传送数据分组时,可能存在本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于控制与所接收的音频信号相关联的丢失音频帧的隐藏方法的方法,所述方法包括:解码(901)所接收的音频信号的第一音频帧,以获得经修正的离散余弦变换MDCT系数;基于根据所解码的所述第一音频帧的所解码的所述MDCT系数确定(307

309、903)第一频谱形状的值,所述第一频谱形状包括多个子频带;解码(907)所接收的音频信号的第二音频帧,以获得所述第二音频帧的MDCT系数;基于根据所解码的所述第二音频帧的所解码的MDCT系数确定(307

309、913)第二频谱形状的值,所述第二频谱形状包括多个子频带;将所述第一频谱形状的所述值和所述第一音频帧的第一帧能量变换(917)为基于第一快速傅立叶变换FFT的频谱分析的第一表示,并且将所述第二频谱形状的所述值和所述第二音频帧的第二帧能量变换(917)为第二FFT频谱分析的第二表示;基于所述第一FFT的所述第一表示和第二FFT的所述第二表示来检测(919)瞬态状况;以及响应于检测到所述瞬态状况,通过选择性地调整替代帧频谱的频谱幅度来修改(921)所述隐藏方法。2.如权利要求1所述的方法,其中,基于所述MDCT系数确定所述第一频谱形状的所述值包括:确定(307)所述MDCT系数的总幅度;对所述第一频谱形状的每个子频带值进行归一化;以及作为所述第一频谱形状的所述值中的值存储每个经归一化的子频带值。3.如权利要求2所述的方法,其中,根据下式确定所述MDCT系数的所述总幅度:其中,shape_tot是所述MDCT系数的所述总幅度,N
MDCT
是MDCT系数的数量并且取决于采样频率,并且q_d(n)是所述MDCT系数。4.如权利要求2

3中的任一项所述的方法,其中,根据下式归一化每个子频带的所述归一化:其中,shape
old
(k)是子频带(k)的频谱形状,shape_tot是所述MDCT系数的所述总幅度,q_d(n)是所述MDCT系数,grp_bin(k)是子频带(k)中的所述MDCT系数的起始索引,并且N
grp
是子频带的数量。5.如权利要求书1

4中的任一项所述的方法,其中,将所述第一频谱形状的所述值和所述第一帧能量变换为基于第一FFT的频谱分析的所述第一表示,并且将所述第二频谱形状的所述值和所述第二帧能量变换为第二FFT频谱分析的第二表示包括:对所述第一频谱形状的所述值和所述第一帧能量以及所述第二频谱形状的所述值和所述第二帧能量应用转
换因子。6.如权利要求5所述的方法,其中,所述转换因子取决于采样频率。7.如权利要求书4

6中的任一项所述的方法,还包括:根据下式将所述第一频谱形状的所述值和所述第一帧能量变换为基于第一FFT的频谱分析的所述第一表示,并且将所述第二频谱形状的所述值和所述第二帧能量变换为第二FFT频谱分析的第二表示:E
oold
(k)=μ
·
shape
oold
(k)
·
E_w
oold
,0≤k<N
grp
和E
old
(k)=μ
·
shape
old
(k)
·
E
wold
,0≤k<N
grp
其中,E
oold
(k)是所述第一表示,μ是所述转换因子,shape
oold
(k)是所述第一频谱形状的子频带(k)的频谱形状,E_w
oold
是所述第一帧能量,E
old
(k)是所述第二表示,shape
old
(k)是所述第二频谱形状的子频带(k)的频谱形状,E_w
old
是所述第二帧能量,并且N
grp
是子频带的数量。8.如权利要求7所述的方法,还包括:确定(1105)与E
oold
(k)和E
old
(k)相关联的所述帧的所述相应频带能量之间的比率是否高于阈值;以及响应于所述比率高于所述阈值,通过选择性地调整(1107)所述替代帧频谱的所述频谱幅度来修改所述隐藏方法。9.如权利要求8所述的方法,其中,根据下式的表达式计算所述替代帧频谱:并且调整所述频谱幅度包括调整β(m)(1107),其中Z(m)是所述替代帧频谱,α(m)是第一幅度衰减因子,β(m)是第二幅度衰减因子,Y(m)是原型帧,θ
k
是相移,并且θ(m)是加性相位分量。10.如权利要求1

9中的任一项所述的方法,还包括:将所述第一频谱形状的所确定的值存储在shape
old
缓冲区中;确定(905)所述第一音频帧的所述第一帧能量,并且将所确定的第一帧能量存储在E_w
old
缓冲区中;响应于对所述第二音频帧解码,将所述第一频谱形状的所确定的值从所述shape
old
缓冲区移动(303、909)到shape
oold
缓冲区;将所确定的第一帧能量从所述E_w
old
缓冲区移动(305、911)到E_w
oold
缓冲区;将所述第二频谱形状的所确定的值存储在所述shape
old
缓冲区中;确定(915)所述第二音频帧的所述第二帧能量,并且将所确定的第二帧能量存储在所述E_w
old
缓冲区中。11.如权利要求1

10中的任一项所述的方法,其中,根据下式确定所述第一帧能量和所述第二帧能量中的每一个的帧能量:E_w
oold
=E_w
old
其中,E_w
oold
是先前帧能量,E_w
old
是计算的所述第一帧或计算的所述第二帧的所述帧能量,w
whr
是长FFT频谱分析窗口,x
prev
是用于创建潜在地即将到来的丢失帧的替代的时域原型信号,并且L
prot
是在所述x
prev
信号中的样本的数量。12.如权利要求10

11中的任一项所述的方法,还包括:接收坏帧指示符(403、501);响应于接收到所述坏帧指示符,转储清除所述shape
oold
缓冲区和所述E_w
oold
能量缓冲区;接收所接收的音频信号的新音频帧;基于根据对所述新音频帧解码的所解码的MDCT系数确定新频谱形状的值(503),并且将所述新频谱形状的所计算的值存储在所述shape
old
缓冲区和所述shape
oold
缓冲区中(405),所述新频谱形状包括多个子频带;以及确定所述音频帧的新帧能量(505),并且将所计算的新帧能量存储在所述E_w
old
缓冲区和所述E_w
oold
缓冲区中(407)。13.一种解码器设备(1201、1301),适于执行根据权利要求1

12中至少一个权利要求所述的操作。14.一种配置成控制与所接收的音频信号相关联的丢失音频帧的隐藏方法的设备(1201、1301),所述设备配置成:解码所接收的音频信号的第一音频帧以获得经修正的离散余弦变换MDCT系数;基于根据所解码的所述音频帧的所解码的MDCT系数确定第一频谱形状的值,所述第一频谱形状包括多个子频带;解码所接收的音频信号的第二音频帧;基于根据所解码的所述第二音频帧的所解码的MDCT系数确定第二频谱形状的值,所述第二频谱形状包含多个子频带;将所述第一频谱形状的所述值和所述第一音频帧的第一帧能量变换为基于第一快速傅立叶变换FFT的频谱分析的第一表示,并且将所述第二频谱形状的所述值和所述第二音频帧的第二帧能量变换为第二FFT频谱分析的第二表示;基于所述第一FFT的所述第一表示和第二FFT的所述第二表示来检测瞬态状况;以及响应于检测到所述瞬态状况,通过选择性地调整替代帧频谱的频谱幅度来修改所述隐藏方法。15.如权利要求14所述的设备,其中,所述设备配置成执行权利要求2

11的操作。16.一种配置成控制与所接收的音频信号相关联的丢失音频帧的隐藏方法的解码器(1201、1301),所述解码器设备包括:处理器(1305);以及存储指令的存储器(1311),所述指令在由所述处理器执行时使所述解码器(1201、1301)执行包括以下内容的操作:解码(901)所接收的音频信号的第一音频帧以获得经修正的离散余弦变换MDCT系数;基于根据所解码的所述第一音频帧的所解码的MDCT系数确定(903)第一频谱形状的值,所述第一频谱形状包括多个子频带;解码(907)所接收的音频信号的第二音频帧;
...

【专利技术属性】
技术研发人员:M
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1