解码语音的音调增强的方法和装置制造方法及图纸

技术编号:3046259 阅读:144 留言:0更新日期:2012-04-11 18:40
在考虑解码的声音信号的感知质量对这个解码的声音信号进行后处理的方法和装置中,解码的声音信号被分解为多个频率子带信号,并将后处理应用到至少一个频率子带信号中。在这个至少一个频率子带信号的后处理之后,将频率子带信号相加以产生输出的后处理的解码的声音信号。这样,可以对所需的一或多个子带实施后处理而保持其它的子带基本不变。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于考虑增强解码的声音信号的感知质量对这种解码的声音信号进行后处理的方法和装置。这些后处理方法和装置具体应用于(但不专用于)声音(包括语音)信号的数字编码。例如,这些后处理方法和装置也可用于其中噪声源可能来自任何媒体或系统(不必与编码或量化噪声相关度)的信号增强的更一般的情况。
技术介绍
2.当前的技术概述2.1语音编码器语音编码器被广泛地用于数字通信系统以有效地发送和/或存储语音信号。在数字系统中,模拟输入语音信号首先以适当的采样速率采样,然后在数字域中对连续的语音采样做进一步的处理。具体地,语音编码器接收语音采样作为输入,产生压缩的输出位流以通过通道发送或存储在适当的存储媒体中。在接收器中,语音解码器接收该位流作为输入,并产生一输出重构的语音信号。有用的是,语音编码器必须以低于该数字的位速率的位速率产生压缩的位流,即采样的输入语音信号。已有技术的语音编码器通常实现至少16比1的压缩比,并仍然能够实现高质量的语音解码。许多这些已有技术的语音编码器基于具有取决于不同算法的不同变型(variant)的CELP(激励码的线性预测)模型。在CELP编码中,数字语音信号在称为帧的语音采样的连续块中进行处理。对于每帧,编码器从数字语音采样中抽取数字地编码的多个参数,然后发送和/或存储它。该解码器被设计成处理所接收的参数以重构或合成语音信号的指定的帧。通常,通过CELP编码器从数字语音采样中抽取下面的参数-在变换域中发送的线性预测系数(LP系数)比如线谱频率(LSF)或者导抗(immitance)谱频率(ISF); -音调参数,包括音调延迟(或时滞)和音调增益;和-革新(innovative)激励参数(固定码本索引和增益)。音调参数和革新激励参数一起描述了称为激励信号的信号。这个激励信号作为输入提供给由LP系数描述的线性预测(LP)滤波器。LP滤波器可以看作声道(vocal tract)的模型,而激励信号可以被看作声门(glottis)的输出。通常每帧中计算并发送LP或LSF系数,而在每帧中计算并发送音调和革新激励参数几次。更具体地说,每个帧分解为称为子帧的几个信号块,在每个子帧上计算并发送音调参数和革新激励参数。一个帧通常具有10至30毫秒的持续时间,而一个子帧通常具有5毫秒的持续时间。几种语音编码标准基于代数CELP(ACELP)模型,更准确地说,ACELP算法。ACELP的一个主要特征是使用代数码本来对每个子帧的新激励编码。代数码本分解在一组交错的脉冲位置的轨道(track)中的子帧。仅仅每轨道的几个非零幅值脉冲被允许,并且每个非零幅值脉冲限制到对应的轨道的位置。编码器使用快速搜索算法来查找最佳的脉冲位置和每个子帧的脉冲的幅值。ACELP算法的描述参见R.SALAMI等人的文章“Design and description ofCS-ACELPa toll quality 8/kb/s speech coder”,IEEE Trans.On Speech andAudio Proc.,Vol.6,No.2,pp.116-130,March 1998,在此以引用参考的方式将其结合在本申请中,该文章描述了在8kbits/秒(second)的ITU-T G.729CS-ACELP窄带语音编码算法。应该注意,根据所涉及的标准不同ACELP新码本搜索有几个变型(variation)。本专利技术不依赖于这些变型,由于它仅应用于解码的(合成的)语音信号的后处理。基于ACELP算法的最近的标准是ETSI/3GPP AMR-WB语音编码算法,这种算法也由ITU-T(ITU(国际电信联盟)的电信标准化部门)作为Recommendation G.722.2采用[ITU-T Recommendation G.722.2“Widebandcoding of speech at around 16kbits/s using Adaptive Multi-RateWideband(AMR-WB)”,Geneva,2002],[3GPP TS26.190,“AMR WidebandSpeech CodecTranscoding Functions,”3GPP Technical Specification]。AMR-WB是为在6.6和23.85kbits/秒之间的9种不同的位速率上工作而设计的多速率算法。本领域普通技术人员知道解码的语音的质量一般随位速率增加。AMR-WB已经被设计为在较差的通道条件下使蜂窝通信系统能降低语音编码器的位速率;位速率转换为通道编码位以增加发送的位的保护。这样,发送的位的总体质量可以保持在比语音编码器在单个固定的位速率下工作的情况较高的水平上。附图7所示为AMR-WB解码器的示意性方块图。更具体地,附图7是解码器的高级表示,强调了接收的位流对仅高达6.4kHz(12.8kHz采样频率)的语音信号进行编码,在解码器根据较低的频带参数合成高于6.4kHz的频率。这个意味着在编码器中使用本领域普通技术人员熟知的多速率变换技术,原始宽带即16kHz采样的语音信号首先下采样到12.8kHz采样频率。附图7的参数解码器701和语音解码器702类似于附附图说明图1的参数解码器106和源解码器107。接收的位流709首先通过参数解码器701解码以复原(recover)提供给语音解码器702的接收的参数710以合成语音信号。在AMR-WB解码器的具体情况下,这些参数是-每20毫秒的帧的ISF系数;-整数音调延迟T0、T0周围的小数音调值T0_frac和每5毫秒子帧的音调增益;和-代数码本形状(脉冲位置和符号)和每5毫秒子帧的增益。根据参数710,语音解码器702被设计成合成对于等于并低于6.4kHz的频率的指定帧的语音信号,由此在12.8kHz采样频率下产生低频带的合成的语音信号712。为复原(recover)对应于16kHz采样频率的全频带信号,AMR-WB解码器包括响应来自参数解码器701的解码的参数710以16kHz采样频率再合成高频带信号711的高频带再合成处理器707。高频带再合成处理器707的细节参见以引用参考的方式结合在本申请中的下面的出版物中-ITU-T Recommendation G.722.2“Wideband coding of speech at around16kbits/s using Adaptive Multi-Rate Wideband(AMR-WB)”,Geneva,2002;-3GPP TS26.190,“AMR Wideband Speech CodecTranscodingFunctions,”3GPP Technical Specification。附图7的高频带再合成处理器707的输出(称为高频带信号711)是在16kHz采样频率下的信号,具有集中到6.4kHz之上的能量。处理器708对高频带信号711至16kHz上采样的低频带语音信号713进行求和以形成在16kHz采样频率下的AMR-WB解码器的完整的解码的语音信号714。2.2对后处理的需求只要语音编码器用于通信系统,则即使在不存在传输误差的情况下合成的或解码的语音信号也永远不会与原始语音信号本文档来自技高网...

【技术保护点】
一种考虑增强解码的声音信号的感知质量对所述的解码的声音信号进行后处理的方法,包括:将解码的声音信号分解为多个频率子带信号,以及将后处理应用到至少一个频率子带信号中但不应用到所有的频率子带信号中。

【技术特征摘要】
CA 2002-5-31 2,388,3521.一种考虑增强解码的声音信号的感知质量对所述的解码的声音信号进行后处理的方法,包括将解码的声音信号分解为多个频率子带信号,以及将后处理应用到至少一个频率子带信号中但不应用到所有的频率子带信号中。2.如权利要求1所述的后处理方法,进一步包括在对所述的至少一个频率子带信号的后处理之后对频率子带信号求和以产生输出的后处理的解码的声音信号。3.如权利要求1所述的后处理方法,其中将后处理应用到至少一个频率子带信号包括对所述的至少一个频率子带信号进行自适应地滤波。4.如权利要求1所述的后处理方法,其中将解码的声音信号分解为多个频率子带信号包括对解码的声音信号进行子带滤波以产生多个频率子带信号。5.如权利要求1所述的后处理方法,其中对于所述的至少一个频率子带信号应用后处理包括对解码的声音信号自适应地滤波;分解解码的声音信号包括对自适应滤波的解码的声音信号进行子带滤波。6.如权利要求1所述的后处理方法,其中分解解码的声音信号为多个频率子带信号包括对解码的声音信号高通滤波以产生频率高带信号;和对解码的声音信号低通滤波以产生频率低带信号;和应用后处理到至少一个频率子带信号包括在对解码的声音信号低通滤波之前应用后处理到解码的声音信号以产生频率低带信号。7.如权利要求6所述的后处理方法,其中应用后处理到解码的声音信号包括对所述的解码的声音信号音调增强以降低在解码的声音信号中的内谐波噪声。8.如权利要求7所述的后处理方法,进一步包括在音调增强所述的解码的声音信号之前对解码的声音信号低通滤波。9.如权利要求6所述的后处理方法,进一步包括对频率高带和低带信号求和以产生输出的后处理的解码的声音信号。10.如权利要求1所述的后处理方法,其中分解解码的声音信号为多个频率子带信号包括对解码的声音信号带通滤波以产生频率上带信号;和对解码的声音信号进行低通滤波以产生频率下带信号;和应用后处理到至少一个频率子带信号包括应用后处理到频率下带信号。11.如权利要求10所述的后处理方法,其中应用后处理到频率下带信号包括在对解码的声音信号低通滤波之前音调增强所述的频率下带信号。12.如权利要求10所述的后处理方法,进一步包括对频率上带和下带信号求和以产生输出的后处理解码的声音信号。13.如权利要求1所述的后处理方法,其中分解解码的声音信号为多个频率子带信号包括对解码的声音信号低通滤波以产生频率低带信号;和应用后处理到至少一个频率子带信号包括应用后处理到频率低带信号。14.如权利要求13所述的后处理方法,其中应用后处理到频率低带信号包括通过用于解码的声音信号的内谐波衰减的内谐波滤波器处理解码的声音信号。15.如权利要求14所述的后处理方法,其中应用后处理到频率低带信号包括将内谐波滤波的解码的声音信号乘以自适应的音调增强的增益。16.如权利要求14所述的后处理方法,进一步包括在通过内谐波滤波器处理解码的声音信号之前对解码的声音信号低通滤波。17.如权利要求13所述的后处理方法,进一步包括对解码的声音信号和频率低带信号求和以产生输出的后处理的解码的声音信号。18.如权利要求13所述的后处理方法,其中对于解码的声音信号的内谐波衰减,应用后处理到频率低带信号包括通过具有如下传递函数的内谐波滤波器处理解码的声音信号y[n]=12χ[n]+14{χ[n-T]+χ[n+T]}]]>这里x[n]是解码的声音信号,y[n]是在指定的子带中的内谐波滤波的解码声音信号,以及T是解码的声音信号的音调延迟。19.如权利要求18所述的后处理方法,进一步包括对未处理的解码的声音信号和内谐波滤波的频率低带信号求和以产生输出的后处理的解码声音信号。20.如权利要求1所述的后处理方法,其中将后处理应用到至少一个频率子带信号包括使用下式音调增强解码的声音信号y[n]=(1-α2)χ[n]+α4{χ[n-T]+χ[n+T]}]]>这里x[n]是解码的声音信号,y[n]是在指定的子带中的音调增强的解码声音信号,T是解码的声音信号的音调延迟,α是为控制解码的声音信号的内谐波衰减量在0和1之间变化的系数。21.如权利要求20所述的后处理方法,其中包括接收通过位流的音调延迟T。22.如权利要求20所述的后处理方法,其中包括对来自接收的编码的位流的音调延迟T进行解码。23.如权利要求20所述的后处理方法,其中响应改善的音调跟踪的解码声音信号计算音调延迟T。24.如权利要求1所述的后处理方法,其中在解码的过程中从较高的采样频率到较低的采样频率下采样声音信号,以及其中将解码的声音信号分解为多个频率子带信号包括从较低的采样频率到较高的采样频率对解码的声音信号上采样。25.如权利要求24所述的后处理方法,其中将解码的声音信号分解为多个频率子带信号包括对解码的声音信号子带滤波,以及其中将从较低的频率到较高的频率的解码的声音信号的上采样结合到子带滤波。26.如权利要求24所述的后处理方法,包括对解码的声音信号带通滤波以产生频率上带信号,所述的解码的声音信号的带通滤波与从较低的采样频率到较高的采样频率的解码的声音信号的上采样组合;和后处理解码的声音信号并对后处理的解码的声音信号低通滤波以产生频率下带信号,所述的后处理的解码的声音信号的低通滤波与从较低的采样频率到较高的采样频率的后处理的解码的声音信号的上采样组合。27.如权利要求26所述的后处理方法,进一步包括将频率上带信号与频率下带信号相加以形成输出的后处理的和上采样的解码的声音信号。28.如权利要求26所述的后处理方法,其中解码的声音信号的后处理包括音调增强解码的声音信号以降低在解码的声音信号中的内谐波噪声。29.如权利要求28所述的后处理方法,其中音调增强解码的声音信号包括通过下式处理解码的声音信号y[n]=(1-α2)χ[n]+α4{χ[n-T]+χ[n+T]}]]>这里x[n]是解码的声音信号,y[n]是在指定的子带中的音调增强的解码声音信号,T是解码的声音信号的音调延迟,α是为控制解码的声音信号的内谐波衰减量在0和1之间变化的系数。30.如权利要求1所述的后处理方法,其中将解码的声音信号分解为多个频率子带信号包括将解码的声音信号分解为频率上带信号和频率下带信号;和将后处理应用到至少一个频率子带信号包括对频率下带信号进行后处理。31.如权利要求1所述的后处理方法,其中将后处理应用到所述的至少一个频率子带信号包括确定解码的声音信号的音调值;根据确定的音调值计算具有在解码的声音信号的基本频率之下的截止频率的高通滤波器;和通过计算的高通滤波器处理解码的声音信号。32.一...

【专利技术属性】
技术研发人员:布鲁诺贝塞特克劳德拉夫莱姆米兰吉利尼克罗奇勒菲夫里
申请(专利权)人:沃伊斯亚吉公司
类型:发明
国别省市:CA[加拿大]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利