【技术实现步骤摘要】
【国外来华专利技术】多模式空间音频编码的舒适噪声生成
[0001]公开了与多模式空间音频不连续传输(DTX)和舒适噪声生成相关的实施例。
技术介绍
[0002]尽管电信网络中的容量在不断增加,但是限制每个通信信道所需的带宽仍然令人非常关注。在移动网络中,针对每个呼叫的传输带宽较小意味着移动网络可以并行服务于大量用户。降低传输带宽也会在移动设备和基站两者中产生较低的功耗。这转化为给移动运营商节约了能量和成本,而最终用户将经历延长的电池寿命和增加的通话时间。
[0003]用于减少语音通信中的传输带宽的一种这样的方法是利用语音中的自然停顿。在大多数对话中,一次仅一个讲话者是活动的;因此在一个方向上的语音停顿通常会占据信号的一半以上。使用典型对话的这一属性来减小传输带宽的方法是采用不连续传输(DTX)方案,其中在语音停顿期间中断活动信号编码。针对所有3GPP移动电话标准(包括2G、3G和VoLTE)对DTX方案进行了标准化。它也通常用于IP语音(VOIP)系统。
[0004]在语音停顿期间,通常发送背景噪声的极低比特率编码,以允许接收端 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于生成舒适噪声的方法,包括:针对第一空间音频编码模式下的至少一个音频信号提供(s1202)背景噪声参数的第一集合N1,其中,所述第一空间音频编码模式用于活动段;针对第二空间音频编码模式下的所述至少一个音频信号提供(s1204)背景噪声参数的第二集合N2,其中,所述第二空间音频编码模式用于非活动段;使所述背景噪声参数的第一集合N1适配于(s1206)所述第二空间音频编码模式,从而提供适配的背景噪声参数的第一集合通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成(s1208)舒适噪声参数;以及基于所述舒适噪声参数针对至少一个输出音频声道生成(s1210)舒适噪声。2.根据权利要求1所述的方法,其中,针对所述至少一个输出音频声道生成舒适噪声包括:将所生成的舒适噪声参数应用于至少一个中间音频信号。3.根据权利要求1所述的方法,其中,针对所述至少一个输出音频声道生成舒适噪声包括对所述至少一个中间音频信号的上混。4.根据权利要求1至3中任一项所述的方法,其中,所述至少一个音频信号基于至少两个输入音频声道的信号,并且其中,所述背景噪声参数的第一集合N1和所述背景噪声参数的第二集合N2各自基于单个音频信号,其中,所述单个音频信号基于对所述至少两个输入音频声道的信号的下混。5.根据权利要求1至4中任一项所述的方法,其中,所述至少一个输出音频声道包括至少两个输出音频声道。6.根据权利要求1至5中任一项所述的方法,其中,提供背景噪声参数的第一集合N1包括:从节点接收所述背景噪声参数的第一集合N1。7.根据权利要求1至6中任一项所述的方法,其中,提供背景噪声参数的第二集合N2包括:从节点接收所述背景噪声参数的第二集合N2。8.根据权利要求1所述的方法,其中,使所述背景噪声参数的第一集合N1适配于所述第二空间音频编码模式包括应用变换函数。9.根据权利要求8所述的方法,其中,所述变换函数包括N1、NS1和NS2的函数,其中,NS1包括指示所述第一空间音频编码模式的背景噪声的下混和/或空间特性的空间编码参数的第一集合,以及NS2包括指示所述第二空间音频编码模式的背景噪声的下混和/或空间特性的空间编码参数的第二集合。10.根据权利要求8至9中任一项所述的方法,其中,应用所述变换函数包括计算其中,s
trans
是标量补偿因子。11.根据权利要求10所述的方法,其中,s
trans
具有以下值:其中,ratio
LR
是下混比,C对应相干性或相关系数,以及c由下式给出
其中,g和γ是增益参数。12.根据权利要求10所述的方法,其中,s
trans
具有以下值:其中,ratio
LR
是下混比,C对应于相干性或相关系数,以及c由下式给出其中,g、γ和
right
是增益参数。13.根据权利要求1至12中任一项所述的方法,其中,所述转换周期是固定长度的非活动帧。14.根据权利要求1至12中任一项所述的方法,其中,所述转换周期是可变长度的非活动帧。15.根据权利要求1至14中任一项所述的方法,其中,通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声包括:应用和N2的加权平均。16.根据权利要求1至15中任一项所述的方法,其中,通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数包括计算:其中,CN是所生成的舒适噪声参数,c
inactive
是当前的非活动帧计数,以及k是指示应用和N2的所述加权平均的非活动帧的数量的所述转换周期的长度。17.根据权利要求1至15中任一项所述的方法,其中,通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数包括计算:其中
如果c
inactive
<kr2(b)=r0(b),否则其中,CN是所生成的舒适噪声参数,c
inactive
是当前的非活动帧计数,k是指示应用和N2的所述加权平均的非活动帧的数量的所述转换周期的长度,以及b是频率子带索引。18.根据权利要求17所述的方法,其中,生成舒适噪声参数包括针对频率子带b的至少一个频率系数k
b
计算:19.根据权利要求16至18中任一项所述的方法,其中,k被确定为:k=
‑
Mr1+M,如果r1<1否则其中,M是k的最大值,并且r1是估计的背景噪声电平的能量比,被确定如下:其中,b=b0,
…
,b
N
‑1是N个频率子带,是指针对给定子带b的的适配的背景噪声参数,以及N2(b)是指针对所述给定子带b的N2的适配的背景噪声参数。20.根据权利要求1至14中任一项所述的方法,其中,通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数包括:应用和N2的非线性组合。21.根据权利要求1至20中任一项所述的方法,还包括:确定通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数,其中,通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数是作为确定通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数的结果而执行的。22.根据权利要求21所述的方法,其中,确定通过在转换周期内组合所述适配的背景噪声参数的第一集合和所述背景噪声参数的第二集合N2来生成舒适噪声参数是基于评估主要声道的第一能量和次要声道的第二能量。23.根据权利要求1至22中任一项所述的方法,其中,所述背景噪声参数的第一集合N1、所述背景噪声参数的第二集合N2、以及所述适配的背景噪声参数的第一集合中的一个
或多个包括描述信号特性和/或空间特性的一个或多个参数,所述一个或多个参数包括以下中的一个或多个:(i)表示信号能量和频谱形状的线性预测系数;(ii)激发能;(iii)声道间相干性;(iv)声道间电平差;以及(v)边增益参数。24.一种节点(1300),所述节点包括处理电路(1402)和存储器,所述存储器包含能够由所述处理电路执行的指令(1444),由此所述处理电路(1402)能够操作用于:针对第一空间音频编码模式下的至少一个音频信号提供背景噪声参数的第一集合N1,其中,所述第一空间音频编码模式用于活动段;针对第二空间音频编码模式下的所述至少...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。