在CELP编解码器中在子帧之间分派比特预算的方法和设备技术

技术编号:24133822 阅读:33 留言:0更新日期:2020-05-13 07:21
一种将比特预算分派给(a)用于编码声音信号的编码器或(b)用于解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的方法和设备。在包括子帧的声音信号的帧中,向第一CELP核心模块部分分派相应比特预算,以及向第二CELP核心模块部分分派在向第一CELP核心模块部分分派它们的相应比特预算之后剩余的比特预算。根据可选方案,在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。该至少一个子帧可以是帧的第一个子帧、第一个子帧之后的至少一个子帧、或者使用声门脉冲形状码本的子帧。

【技术实现步骤摘要】
【国外来华专利技术】在CELP编解码器中在子帧之间分派比特预算的方法和设备
本公开涉及从传输或存储以及合成声音信号(例如语音或音频信号)的角度对该声音信号进行数字编码的技术。编码器使用比特预算将声音信号转换成数字比特流。解码器或合成器然后对传输或存储的比特流进行操作,并将其转换回声音信号。编码器和解码器/合成器通常被称为编解码器。更具体地,但不排他地,本公开涉及用于在编解码器中高效分配比特预算的方法和设备。
技术介绍
以低比特率编码声音的最佳技术之一是码激励线性预测(Code-ExcitedLinearPrediction,CELP)编码。在CELP编码中,声音信号被采样,并且采样的声音信号在通常称为帧的L个样本的连续块中被处理,其中L是预定数目,典型地对应于20ms。CELP背后的主要原理被称为“合成分析(Analysis-by-Synthesis)”,其中可能的解码器输出在编码过程中被合成,然后与原始声音信号进行比较。这种搜索使输入声音信号和合成声音信号在感知加权域中的均方误差最小化。在基于CELP的编码中,声音信号典型地通过全极点数字滤波器1/A(z)对激励进行滤波来合成,该滤波器通常被称为合成滤波器。滤波器A(z)通过线性预测(LinearPrediction,LP)来估计,并表示声音信号样本之间的短期相关性。LP滤波器系数通常每帧计算一次。在CELP编解码器中,帧被进一步分成几个(通常是两(2)到五(5)个)子帧来编码激励,该激励典型地由顺序搜索的两个部分组成。然后它们各自的增益可以被联合量化。在下面的描述中,子帧的数量被表示为N,并且特定子帧的索引被表示为n,其中n=0,…,N-1。激励的第一部分通常从自适应码本中选择。自适应码本激励部分通过在过去的激励中搜索与当前正在被编码的段最相似的段来利用有声语音信号的准周期性(或长期相关性)。自适应码本激励部分由自适应码本索引(即,对应于基音周期的延迟参数)和适当的自适应码本增益来描述,二者都被发送到解码器或被存储以重构与编码器中相同的激励。激励的第二部分通常是从创新码本(innovationcodebook)中选择的创新信号。创新信号对先前语音段和当前编码段之间的演变(差异)进行建模。激励的第二部分由从创新码本中选择的码矢量的索引和创新码本增益(这也被称为固定码本索引和固定码本增益)来描述。为了提高编码效率,最近的编解码器(诸如,例如参考文献[1]中描述的G.718和参考文献[2]中描述的EVS)基于输入声音信号的分类。基于信号特性,基本CELP编码被扩展成几种不同的编码模式。因此,分类需要被传输到解码器或作为信令信息存储。另一种通常高效传输的信令信息是,例如,音频带宽信息。因此,在CELP编解码器中,所谓的CELP“核心模块”部分可以包括:-LP滤波器系数;-自适应码本;-创新(固定)码本;和-自适应和创新码本增益。大多数最新的CELP编解码器基于恒定比特率(ConstantBitRate,CBR)原则。在CBR编解码器中,编码给定的帧的比特预算在编码期间是恒定的,而与声音信号内容或网络特性无关。为了在给定的恒定比特率下获得尽可能好的质量,比特预算被小心地分配在不同的编码部分当中。实际上,给定的比特率下每编码部分的比特预算通常是固定的,并存储在编解码器ROM表中。然而,当编解码器支持的比特率的数量增加时,ROM表的长度成比例地增加,并且在这些表中的搜索变得不太高效。在分派给CELP核心模块的比特预算甚至在编解码器恒定比特率下也可能波动的复杂编解码器中,大的ROM表的问题甚至更加显著。例如,在基于例如输入音频通道的数量、网络反馈、音频带宽、输入信号特性等,来在不同的模块之间分派恒定比特率下的比特预算的复杂的多模块编解码器中,编解码器总比特预算在CELP核心模块和其他不同的模块之间分配。这种其他不同的模块的示例可以包括但不限于带宽扩展(BandwidthExtension,BWE)、立体声模块、帧错误隐藏(FrameErrorConcealment,FEC)模块等,它们在本说明书中统称为“辅助编解码器模块”。基于信号特性或网络反馈,保持每辅助模块分派的比特预算可变通常是有利的。此外,辅助编解码器模块可以自适应地打开和关闭。这种可变性通常不会给编码辅助模块带来问题,因为这些模块中的参数数量通常很少。然而,分派给辅助编解码器模块的波动的比特预算导致分派给相对复杂的CELP核心模块的波动的比特预算。实际上,以给定的比特率分派给CELP核心模块的比特预算通常是通过将编解码器总比特预算减少分派给所有活动的辅助编解码器模块的比特预算(其可以包括编解码器信令比特预算)来获得的。因此,分派给CELP核心模块的比特预算可以在相对大的最小和最大比特率范围之间波动,其粒度小到1比特(即,在20ms的帧长度下为0.05kbps)。将ROM表条目专用于所有可能的CELP核心模块比特率显然是低效的。因此,需要基于有限数量的中间比特率,以精细比特率粒度在不同的模块之间更高效和灵活地分配比特预算。
技术实现思路
根据第一方面,本公开涉及一种将比特预算分派给(a)编码声音信号的编码器或(b)解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的方法,该方法包括:在包括子帧的声音信号的帧中:向第一CELP核心模块部分分派相应比特预算;以及向第二CELP核心模块部分分派在向第一CELP核心模块部分分派相应比特预算之后剩余的比特预算。分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配第二CELP核心模块部分比特预算,以及向帧的至少一个子帧分派更大的比特预算。根据第二方面,提供了一种用于将比特预算分派给(a)编码声音信号的编码器或(b)解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的设备,对于包括子帧的声音信号的帧,该设备包括:第一分派器,将相应比特预算分派给第一CELP核心模块部分;以及第二分派器,向第二CELP核心模块部分分派在向第一CELP核心模块部分分派相应比特预算之后剩余的比特预算。第二分派器在帧的子帧之间分配第二CELP核心模块部分比特预算,以及向帧的至少一个子帧分派更大的比特预算。根据第三方面,提供了一种将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的方法,该方法包括:存储比特预算分派表,该比特预算分派表为多个中间比特率中的每一个,指派相应比特预算给第一CELP核心模块部分;确定CELP核心模块比特率;基于所确定的CELP核心模块比特率选择中间比特率中的一个;向第一CELP核心模块部分分派由比特预算分派表为选择的中间比特率指派的相应比特预算;以及向第二CELP核心模块部分分派在向第一CELP核心模块部分分派由比特预算分派表为选择的中间比特率指派的相应比特预算之后剩余的比特预算。CELP核心模块在声音信号的帧的一个子帧中使用声门脉冲形状码本,并且分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配第二CELP核心模块部分比特预算本文档来自技高网
...

【技术保护点】
1.一种将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的方法,包括:在包括子帧的声音信号的帧中,/n向第一CELP核心模块部分分派相应比特预算;/n向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算,其中分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配所述第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。/n

【技术特征摘要】
【国外来华专利技术】20170920 US 62/560,7241.一种将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的方法,包括:在包括子帧的声音信号的帧中,
向第一CELP核心模块部分分派相应比特预算;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算,其中分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配所述第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


2.根据权利要求1所述的比特预算分派方法,其中,所述至少一个子帧是所述声音信号的帧的第一个子帧。


3.根据权利要求2所述的比特预算分派方法,其中,所述至少一个子帧包括在所述声音信号的帧的第一个子帧之后的至少一个子帧。


4.根据权利要求1至3中任一项所述的比特预算分派方法,其中在帧的子帧之间分配第二CELP核心模块部分比特预算包括尽可能多地使用所述第二CELP核心模块部分比特预算。


5.根据权利要求1所述的比特预算分派方法,其中:
所述CELP核心模块在声音信号的帧的一个子帧中使用声门脉冲形状码本;并且
帧的向其分派更大的比特预算的至少一个帧是使用所述声门脉冲形状码本的子帧。


6.根据权利要求1至5中任一项所述的比特预算分派方法,其中向第一CELP核心模块部分分派相应比特预算包括向所述第一CELP核心模块部分分派比特由预算分派表向所述第一CELP核心模块部分指派的相应比特预算。


7.一种使用CELP核心模块和辅助编解码器模块对声音信号进行编码的方法,包括:
向辅助编解码器模块分派比特预算;
从总编解码器比特预算中减去辅助编解码器模块比特预算,以确定CELP核心模块比特预算;以及
使用根据权利要求1至6中任一项所述的方法,将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


8.一种使用CELP核心模块和辅助编解码器模块对声音信号进行编码的方法,包括:
将第一比特预算分派给编解码器信令;
将第二比特预算分派给辅助编解码器模块;
从总编解码器比特预算中减去第一和第二比特预算,以确定CELP核心模块比特预算;以及
使用根据权利要求1至6中任一所述项的方法,将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


9.根据权利要求7或8所述的对声音信号进行编码的方法,包括确定未使用的比特预算,其包括从总编解码器比特预算中减去(a)分派给辅助编解码器模块的比特预算、(b)分派给第一CELP核心模块部分的比特预算、和(c)分派给第二CELP核心模块部分的比特预算。


10.根据权利要求9所述的对声音信号进行编码的方法,包括将所述未使用的比特预算分派给所述第一CELP核心模块部分中的至少一个的编码。


11.根据权利要求9所述的对声音信号进行编码的方法,包括将所述未使用的比特预算分派给变换域码本的编码。


12.根据权利要求11所述的对声音信号进行编码的方法,其中将所述未使用的比特预算分派给所述变换域码本的编码包括将所述未使用的比特预算的第一部分分派给变换域参数,并将所述未使用的比特预算的第二部分分派给所述变换域码本内的矢量量化器。


13.根据权利要求12所述的对声音信号进行编码的方法,包括在声音信号的帧的所有子帧当中分配所述未使用的比特预算的第二部分。


14.根据权利要求13所述的对声音信号进行编码的方法,其中更大的比特预算被分派给帧的第一个子帧。


15.一种用于将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的设备,对于包括子帧的声音信号的帧,包括:
向第一CELP核心模块部分分派相应比特预算的第一分派器;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算的第二分派器,其中所述第二分派器在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


16.根据权利要求15所述的比特预算分派设备,其中,所述至少一个子帧是所述声音信号的帧的第一个子帧。


17.根据权利要求16所述的比特预算分派设备,其中,所述至少一个子帧包括在所述声音信号的帧的第一个子帧之后的至少一个子帧。


18.根据权利要求15至17中任一项所述的比特预算分派设备,其中,在帧的子帧之间分配第二CELP核心模块部分比特预算包括尽可能多地使用所述第二CELP核心模块部分比特预算。


19.根据权利要求15所述的比特预算分派设备,其中:
CELP核心模块在声音信号的帧的一个子帧中使用声门脉冲形状码本;并且
帧的向其分派更大的比特预算的至少一个帧是使用声门脉冲形状码本的子帧。


20.根据权利要求15至19中任一项所述的比特预算分派设备,其中,所述第一分派器向所述第一CELP核心模块部分分派由比特预算分派表向所述第一CELP核心模块部分指派的相应比特预算。


21.一种使用CELP核心模块和辅助编解码器模块编码声音信号的设备,包括:
向辅助编解码器模块分派比特预算的分派器;
从总编解码器比特预算中减去辅助编解码器模块比特预算,以确定CELP核心模块比特预算的减法器;和
根据权利要求15至20中任一项所述的比特预算分派设备,用于将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


22.一种使用CELP核心模块和辅助编解码器模块编码声音信号的设备,包括:
向编解码器信令分派第一比特预算的分派器;
向辅助编解码器模块分派第二比特预算的分派器;
从总编解码器比特预算中减去第一和第二比特预算,以确定CELP核心模块比特预算的减法器;和
根据权利要求15至20中任一项所述的比特预算分派设备,用于将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


23.根据权利要求21或22所述的对声音信号进行编码的设备,包括用于确定未使用的比特预算的减法器,其从总编解码器比特预算中减去(a)分派给辅助编解码器模块的比特预算、(b)分派给第一CELP核心模块部分的比特预算、和(c)分派给第二CELP核心模块部分的比特预算。


24.根据权利要求23所述的对声音信号进行编码的设备,包括将所述未使用的比特预算分派给所述第一CELP核心模块部分中的至少一个的编码的分派器。


25.根据权利要求23所述的对声音信号进行编码的设备,包括将未使用的比特预算分派给变换域码本的编码的分派器。


26.根据权利要求25所述的对声音信号进行编码的设备,其中,将未使用的比特预算分派给变换域码本的编码的分派器将未使用的比特预算的第一部分分派给变换域参数,并将未使用的比特预算的第二部分分派给变换域码本内的矢量量化器。


27.根据权利要求26所述的对声音信号进行编码的设备,其中,未使用的比特预算的分派器在声音信号的帧的所有子帧当中分配未使用的比特预算的第二部分。


28.根据权利要求27所述的对声音信号进行编码的设备,其中,未使用的比特预算的分派器将更大的比特预算分派给帧的第一个子帧。


29.一种用于将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的设备,对于包括子帧的声音信号的帧,包括:
至少一个处理器;和
耦合到所述处理器并包括非暂时性指令的存储器,所述指令在被运行时使得处理器实施:
向第一CELP核心模块部分分派相应比特预算的第一分派器;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算的第二分派器,其中所述第二分派器在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


30.一种用于将比特预算分派给编码声音信号的编码器的CELP核心模块的多个第一部分和第二部分的设备,对于包括子帧的声音信号的帧,包括:
至少一个处理器;和
耦合到所述处理器并包括非暂时性指令的存储器,所述指令在被运行时使得处理器:
向第一CELP核心模块部分分派相应比特预算;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算,其中分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


31.一种将比特预算分派给解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的方法,在包括子帧的声音信号的帧中,包括:
向第一CELP核心模块部分分派相应比特预算;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算,其中分派第二CELP核心模块部分比特预算包括在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


32.根据权利要求31所述的比特预算分派方法,其中,所述至少一个子帧是所述声音信号的帧的第一个子帧。


33.根据权利要求32所述的比特预算分派方法,其中,所述至少一个子帧包括在所述声音信号的帧的第一个子帧之后的至少一个子帧。


34.根据权利要求31至33中任一项所述的比特预算分派方法,其中,在帧的子帧之间分配第二CELP核心模块部分比特预算包括尽可能多地使用第二CELP核心模块部分比特预算。


35.根据权利要求31所述的比特预算分派方法,其中:
CELP核心模块在声音信号的帧的一个子帧中使用声门脉冲形状码本;并且
帧的向其分派更大的比特预算的至少一个帧是使用声门脉冲形状码本的子帧。


36.根据权利要求31至35中任一项所述的比特预算分派方法,其中向第一CELP核心模块部分分派相应比特预算包括向所述第一CELP核心模块部分分派由比特预算分派表向所述第一CELP核心模块部分指派的相应比特预算。


37.一种使用CELP核心模块和辅助编解码器模块解码声音信号的方法,包括:
向辅助编解码器模块分派比特预算;
从总编解码器比特预算中减去辅助编解码器模块比特预算,以确定CELP核心模块比特预算;以及
使用根据权利要求31至36中任一所述项的方法,将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


38.一种使用CELP核心模块和辅助编解码器模块解码声音信号的方法,包括:
将第一比特预算分派给编解码器信令;
将第二比特预算分派给辅助编解码器模块;
从总编解码器比特预算中减去第一和第二比特预算,以确定CELP核心模块比特预算;以及
使用根据权利要求31至36中任一所述项的方法,将CELP核心模块比特预算分派给第一CELP核心模块部分和第二CELP核心模块部分。


39.根据权利要求37或38所述的用于解码声音信号的方法,包括确定未使用的比特预算,其包括从总编解码器比特预算中减去(a)分派给辅助编解码器模块的比特预算、(b)分派给第一CELP核心模块部分的比特预算、和(c)分派给第二CELP核心模块部分的比特预算。


40.根据权利要求39所述的用于解码声音信号的方法,包括将未使用的比特预算分派给第一CELP核心模块部分中的至少一个的解码。


41.根据权利要求39所述的用于解码声音信号的方法,包括将未使用的比特预算分派给变换域码本的解码。


42.根据权利要求41所述的用于解码声音信号的方法,其中将所述未使用的比特预算分派给所述变换域码本的解码包括将所述未使用的比特预算的第一部分分派给变换域参数,并将所述未使用的比特预算的第二部分分派给所述变换域码本内的矢量量化器。


43.根据权利要求42所述的用于解码声音信号的方法,包括在声音信号的帧的所有子帧当中分配所述未使用的比特预算的第二部分。


44.根据权利要求43所述的用于解码声音信号的方法,其中更大的比特预算被分派给所述帧的第一个子帧。


45.一种用于将比特预算分派给用于解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的设备,对于包括子帧的声音信号的帧,包括:
向第一CELP核心模块部分分派相应比特预算的第一分派器;
向第二CELP核心模块部分分派在向第一CELP核心模块部分分派所述相应比特预算之后剩余的比特预算的第二分派器,其中所述第二分派器在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。


46.根据权利要求45所述的比特预算分派设备,其中,所述至少一个子帧是所述声音信号的帧的第一个子帧。


47.根据权利要求45所述的比特预算分派设备,其中,所述至少一个子帧包括在所述声音信号的帧的第一个子帧之后的至少一个子帧。


48.根据权利要求45至47中任一项所述的比特预算分派设备,其中,在帧的子帧之间分配第二CELP核心模块部分比特预算包括尽可能多地使用所述第二CELP核心模块部分比特预算。


49.根据权利要求45所述的比特预算分派设备,其中:
CELP核心模块在声音信号的帧的一个子帧中使用声门脉冲形状码本;并且
帧的向其分派更大的比特预算的至少一个帧是使用声门脉冲形状码本的子帧。


50.根据权利要求45至49中任一项所述的比特预算分派设备,其中,所述第一分派器向所述第一CELP核心模块部分分派由比特预算分派表向所述第一CELP核心模块部分指派的相应比特预算。


51.一种使用CELP核心模块和辅助编解码器模块解码声音信号的设备,包括:
向辅助编解码器模块分派比特预算的分派器;
从总编解码器比特预算中减去辅助编解码器模块比特预算,以确定CELP核心...

【专利技术属性】
技术研发人员:V埃克斯勒
申请(专利权)人:沃伊斯亚吉公司
类型:发明
国别省市:加拿大;CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1