对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法技术

技术编号:37385091 阅读:19 留言:0更新日期:2023-04-27 07:25
公开了一种用于音频编码/解码的设备和方法,其对过渡部分中的编码失真具有鲁棒性。一种音频编码方法包括:通过对输入信号进行时间到频率(T/F)变换来输出频域信号;输出频域残差信号,在该频域残差信号中,通过对频域信号应用频域噪声整形(FDNS)编码从频域信号中去除了频率轴包络;输出时域残差信号,在该时域残差信号中,通过基于频域残差信号执行线性预测系数(LPC)解析去除了时间轴包络;以及量化并发送时域残差信号。并发送时域残差信号。并发送时域残差信号。

【技术实现步骤摘要】
【国外来华专利技术】对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法


[0001]本公开涉及一种音频编码/解码设备和方法,并且更具体地,涉及一种与对过渡部分中的编码失真具有鲁棒性的音频编码/解码技术有关的设备和方法。

技术介绍

[0002]音频编码过程中过渡部分的出现可能导致编码效率的降低和音质失真。例如,在同时演奏钢琴和吉他的情况下对两个乐器的声音过渡或重叠的部分进行编码需要应用各种编码方案并且消耗大量比特。
[0003]当发生过渡部分时,传统的音频编码方法通过改变要解析的单位帧的长度或应用时间噪声整形技术来部分地抑制过渡部分,然而,这仍然需要高比特消耗并导致音质失真。
[0004]因此,需要一种最小化由过渡部分的出现引起的编码效率的降低和声音质量的损失的方法。

技术实现思路

[0005]技术目标
[0006]本公开提供了一种设备和方法,用于通过在相同框架中操作执行编码来提高编码效率并最小化声音质量的损失,而即使当发生过渡部分时也没有异常处理。
[0007]技术方案
[0008]根据一方面,提供了一种音频编码方法,包括:通过对输入信号进行时间到频率(T/F)变换来输出频域信号,输出通过对频域信号应用频域噪声整形(FDNS)编码而从频域信号中去除了频率轴包络的频域残差信号,输出通过基于频域残差信号执行线性预测系数LPC解析去除了时间轴包络的时域残差信号,以及量化并发送时域残差信号。
[0009]输出频域残差信号可以包括从输入信号获得LPC信息,从LPC信息获得频率轴包络信息,以及通过从频域信号中去除频率轴包络信息来生成频域残差信号。
[0010]输出频域残差信号还可以包括将LPC信息变换为频域中的LPC频率信息,并且获得包络信息可以包括获得LPC频率信息的绝对值作为包络信息。
[0011]输出时域残差信号可以包括:从频域残差信号获得LPC,以及输出时域残差信号,在所述时域残差信号中,通过使用LPC对频域残差信号进行LPC解析去除了频率轴包络信息和时间轴包络信息。
[0012]根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号,通过对时域残差信号进行LPC解析来输出频域残差信号,通过对频域残差信号执行FDNS解码来输出频域信号,通过对频域信号进行频率到时间(F/T)变换来输出时域信号,以及通过对时域信号执行时域混叠消除(TDAC)来恢复输入信号。
[0013]接收信号可以包括从输入到音频编码设备的输入信号提取的LPC信息、从输入信号的频域残差信号获得的LPC以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且输出时域残差信号可以包括通过对比特流进行反量化来恢复时域残差
信号。
[0014]输出频域残差信号可以包括输出频域残差信号,在所述频域残差信号中,通过使用包括在接收信号中的LPC对时域残差信号进行LPC合成恢复了时间轴包络信息。
[0015]输出频域信号可以包括从包括在接收信号中的LPC频率信息获得频率轴包络信息,并且通过在频域残差信号中恢复频率轴包络信息来输出频域信号。
[0016]根据一方面,提供了一种音频编码方法,包括:通过对输入信号进行T/F变换来输出频域信号,通过对频域信号应用FDNS编码来输出从频域信号中去除了频率轴包络的频域残差信号,通过对频域残差信号进行F/T变换来输出时域信号,对时域信号应用TDAC,输出通过对应用了TDAC的时域信号进行时间噪声整形(TNS)

2编码而去除了时间轴包络的时域残差信号,并且量化并发送时域残差信号。
[0017]输出时域残差信号可以包括:通过希尔伯特变换将应用了TDAC的时域信号变换为解析形式,通过对解析形式执行离散傅里叶变换(DFT)来获得复合LPC,通过对复合LPC应用逆离散傅里叶变换(IDFT)和绝对值(ABS)运算来获得时间轴包络信息,以及通过从应用了TDAC的时域信号中去除时间轴包络信息来获得时域残差信号。
[0018]输出时域残差信号可以包括:通过希尔伯特变换将应用了TDAC的时域信号变换为解析形式,通过对解析形式执行DFT来获得复合LPC,通过对被应用了TDAC的时域信号执行DFT来输出第二频域残差信号,通过使用复合LPC对第二频域残差信号进行LPC解析来去除时间轴包络信息,以及通过对去除了时间轴包络信息的第二频域残差信号应用IDFT来获得时域残差信号。
[0019]根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号,通过对时域残差信号进行TNS

2解码来输出时域信号,通过对时域信号进行T/F变换来输出频域残差信号,通过对频域残差信号执行FDNS解码来输出频域信号,通过对频域信号进行F/T变换来输出第二时域信号,以及通过对第二时域信号执行TDAC来恢复输入信号。
[0020]接收信号可以包括从输入到音频编码设备的输入信号中提取的LPC信息、从输入信号的时域信号获得的复合LPC以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且时域残差信号的输出可以包括通过对比特流进行反量化来恢复时域残差信号。
[0021]输出时域信号可以包括:通过对复合LPC应用IDFT和ABS运算来获得时间轴包络信息,并且通过在时域残差信号中恢复时间轴包络信息来输出时域信号。
[0022]输出时域信号可以包括:通过对时域残差信号执行DFT来输出第二频域残差信号,通过使用复合LPC对第二频域残差信号进行LPC解析来恢复时间轴包络信息,以及通过对恢复了时间轴包络信息的第二频域残差信号应用IDFT来获得时域信号。
[0023]根据一方面,提供了一种音频编码方法,包括:输出通过对输入信号进行LPC解析去除了频率轴包络的时域信号,输出通过对时域信号进行TNS

2编码去除了时间轴包络的时域残差信号,以及量化和发送时域残差信号。
[0024]时域残差信号的输出可以包括:通过希尔伯特变换将时域信号变换为解析形式,通过对解析形式执行DFT来获得复合LPC,通过对复合LPC应用IDFT和ABS运算来获得时间轴包络信息,以及通过从时域信号中去除时间轴包络信息来获得时域残差信号。
[0025]根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号;通过对时域残差信号进行TNS

2解码来输出时域信号;以及通过将时域信号与从音频编码设备接收的LPC信息进行合成来恢复输入信号。
[0026]接收信号可以包括从输入到音频编码设备的输入信号中提取的LPC信息、从输入信号的时域信号获得的复合LPC以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且输出时域残差信号可以包括通过对比特流进行反量化来恢复时域残差信号。
[0027]输出时域信号可以包括:通过对复合LPC应用IDFT和ABS运算来获得时间轴包络信息,并且通过在时域残差本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音频编码方法,包括:通过对输入信号进行时间到频率T/F变换来输出频域信号;输出频域残差信号,在所述频域残差信号中,通过对所述频域信号应用频域噪声整形FDNS编码从所述频域信号中去除了频率轴包络;通过基于所述频域残差信号执行线性预测系数LPC解析来输出去除了时间轴包络的时域残差信号;以及量化并发送所述时域残差信号。2.如权利要求1所述的音频编码方法,其中,输出所述频域残差信号包括:从所述输入信号获得LPC信息;从所述LPC信息获得频率轴包络信息;以及通过从所述频域信号中去除所述频率轴包络信息来生成所述频域残差信号。3.如权利要求2所述的音频编码方法,其中,输出所述频域残差信号还包括:将所述LPC信息变换为频域中的LPC频率信息,其中,获得所述包络信息包括获得所述LPC频率信息的绝对值作为所述包络信息。4.如权利要求1所述的音频编码方法,其中,输出所述时域残差信号包括:从所述频域残差信号获得LPC;以及输出所述时域残差信号,在所述时域残差信号中,通过使用所述LPC对所述频域残差信号进行LPC解析去除了频率轴包络信息和时间轴包络信息。5.一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号;通过对所述时域残差信号进行线性预测系数LPC解析来输出频域残差信号;通过对所述频域残差信号执行频域噪声整形FDNS解码来输出频域信号;通过对所述频域信号进行频率到时间F/T变换来输出时域信号;以及通过对所述时域信号执行时域混叠消除TDAC来恢复输入信号。6.如权利要求5所述的音频解码方法,其中,所述接收信号包括从输入到音频编码设备的输入信号中提取的LPC信息、从所述输入信号的频域残差信号获得的LPC以及所述输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且输出所述时域残差信号包括通过对比特流进行反量化来恢复所述时域残差信号。7.如权利要求6所述的音频解码方法,其中,输出所述频域残差信号包括:输出所述频域残差信号,在所述频域残差信号中,通过使用包括在所述接收信号中的LPC对所述时域残差信号进行LPC合成恢复了时间轴包络信息。8.如权利要求6所述的音频解码方法,其中,输出所述频域信号包括:从包括在所述接收信号中的LPC频率信息中获得频率轴包络信息,以及通过在所述频域残差信号中恢复频率轴包络信息来输出所述频域信号。9.一种音频编码方法,包括:通过对输入信号进行时间到频率T/F变换来输出频域信号;输出频域残差信号,在所述频域残差信号中,通过对所述频域信号应用频域噪声整形FDNS编码从所述频域信号中去除了频率轴包络;通过对所述频域残差信号进行频率到时间F/T变换来输出时域信号;
将时域混叠消除TDAC应用于所述时域信号;输出时域残差信号,在所述时域残差信号中,通过对应用了TDAC的所述时域信号进行时间噪声整形TNS

2编码去除了时间轴包络;以及量化并发送所述时域残差信号。10.如权利要求9所述的音频编码方法,其中,输出所述时域残差信号包括:通过希尔伯特变换将应用了TDAC的所述时域信号变换为解析形式;通过对所述解析形式执行离散傅里叶变换DFT来获得复合线性预测系数LPC;通过对所述复合LPC应用离散傅里叶逆变换IDFT和绝对值ABS运算来获得时间轴包络信息;以及通过从应用了TDAC的所述时域信号中去除所述时间轴包络信息来获得所述时域残差信号。11.如权利要求9所述的音频编码方法,其中,输出所述时域残差信号包括:通过希尔伯特变换将应用了TDAC的所述时域信号变...

【专利技术属性】
技术研发人员:白承权成钟模李美淑李泰辰林宇泽张仁瑄
申请(专利权)人:韩国电子通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1