一种音频信号的解码方法及装置制造方法及图纸

技术编号:3048268 阅读:169 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了音频信号的解码方法,包括:当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;将所述较高带分量信息进行频域整形,并获得较高带信号分量;将所述较高带信号分量和所述较低带信号分量进行合成。本发明专利技术还公开了一种音频信号的解码装置和一种音频信号分量信息的频域整形方法。本发明专利技术通过将音频信号的较高带分量信息进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。

【技术实现步骤摘要】

本专利技术涉及语音通信
,特别是涉及一种音频信号的解码方法及 装置。
技术介绍
G.729.1是ITU (International Telecommunication Union,国际电信联盟) 最新发布的新一代语音编解码标准,这种嵌入式语音编解码标准最大的特点 是具有分层编码的特性,能够提供码率范围在8kb/s 32kb/s的窄带到宽带的音 频质量,允许在传输过程中,根据信道状况丢弃外层码流,具有良好的信道 自适应性。 一般来说,在语音编解码领域,窄带信号是指频带0 4000Hz的信 号,宽带信号是指频带在0 8000Hz的信号,超宽带信号是指频带在0 16000Hz 的信号。宽带信号又可以分解为低带信号分量和高带信号分量,低带信号分 量指0 4000Hz的信号,低带信号分量又可以称为窄带信号分量。高带信号分 量是指4000 8000Hz的信号,超高带信号分量是指8000 16000Hz的信号。在G.729.1标准中,通过将码流构造成嵌入式的分层结构来达到分级性, 是一种新型的嵌入式可分层的多速率语音编解码器。输入为20ms的超帧,当 釆样率为16000Hz,帧长为320点。图1为&729.1各层编码器系统框图,语 音编解码器编码的具体过程为输入信号^^()首先经过QMF (Quadrature Mirror Filterbank,正交镜像滤波器)滤波分成(^(2),仏(2》两个子带,低子带 信号经过50Hz截止频率的高通滤波器进行预处理,输出信号&B()使用 8kb/s~12kb/s的窄带嵌入式CELP ( Code-Excited Linear-Prediction,码激励线 性预测)编码器进行编码,^()和12Kb/s码率下CELP编码器的本地合成信号A()之间的差值信号^()经过知觉加权滤波(『M(Z))后的信号《;()通过MDCT (Modified Discrete Cosine Transform, ^修正的离散余弦变换)变换到频 域。加权滤波器『^②包含了增益补偿,用来保持滤波器输出《s()与高子带输入信号^^(w)之间的谱连续性。加权后的差值信号要变换到频域内。高子带分量乘上(-l)进行谱反转之后的信号f()通过截止频率为3000HZ的低通滤波器进行预处理,滤波后的信号s朋()4吏用TDBWE (Time-Domain Bandwidth Extension,时域带宽扩展编码算法)编码器进行编 码。进入TDAC编码模块的&s ()也要先使用MDCT变换到频域上。两组MDCT系数(和S朋⑨最后使用TDAC (Time Domain Alias Cancellation,时域混叠抵消)进行编码。图2为G.729.1各层解码器系统框图,解码器的实际工作模式由接收到的 码流层数决定,也等价于由接收到的码率决定。根据接收端接收到的不同码 率各情况分述如下1、 如果接收到的码率为8kb/s或12kb/s (即仅接收到第一层或者前两层) 第一层或者前两层的码流由嵌入式CELP解码器进行解码,得到解码后的信号 S ,再进行后滤波得到;,经过高通滤波之后进入QMF滤波器组合成 16kHz的宽带信号,其中高带分量置O。2、 如果接收到的码率为14kb/s (即接收到前三层)除了嵌入式CELP解 码器解码出窄带分量以外,TDBWE解码器也解码出高带信号分量〉()。对 ;^(w)进行MDCT变换,把高子带分量谱中3000Hz以上(对应于16kHz采样率 中7000Hz以上)频率分量置0,然后进行逆MDCT变换,迭加之后并进行谱翻 转,然后在QMF滤波器组中与CELP解码器解出的低带分量s :'() —起合成采 样率为16kHz的宽带信号。3、 如果接收到14kb/s以上速乎的码流(对应于前四层或者更多层)除了 ELP解码器解码出低子带分量s :'() 、 TDBWE解码器解码出高子带分量 :()以外,还要使用TDAC解码器解码出低子带加权差分信号和高子带增强 信号,对全带信号进行增强,最终也在QMF滤波器组中合成采样率为16kHz 的宽带信号。G729.1的码流具有分层结构,允许在传输的过程中根据信道的传输能力 从外向内丢弃外层码流,以达到对信道状况的自适应。由编解码的算法描述 中可以看出,如果信道容量随时间较快的进行变化时,在解码器可能时而收到窄带码流(解码速率等于或者低于12kb/s),此时解码出的信号仅包含 4000Hz以下分量;时而收到宽带码流(解码速率等于或者高于14kb/s),此时 解码出的信号则包含0 7000Hz的宽带信号。这种带宽的突然变化,我们称之 为带宽切换,由于高低频对人耳感受的贡献并不相同,因此这样的频繁切换 会给人耳带来明显的不舒适感。特别地,当频繁出现由较窄带宽向较宽带宽 的切换时,人耳将能频繁地明显感觉到听到的声音从沉闷跃变为清脆,因此 需要使用一种技术来减轻这种频繁切换对人耳听觉带来的不舒适感。在G729.1标准中,采用了一种简单的处理算法来解决该问题即在窄带 向宽带切换时,对信号在时域进行能量的渐变处理,即对高带分量的时域能 量加入一个时变渐入因子。将时域信号的高带分量与衰减因子相乘,以期使 窄带信号緩慢变为宽带信号。每次解码器接收到的码流速率为8k或12k b/s时, 过渡帧数c。L鮮被置为0,当解码速率为14kb/s或更高时,过渡帧数计算公 式为画W — = min(謹W — rcv +1, COLW!T — i CT — M4X) 其中09^7^^7_皿=50。即该方法期望在ls时间内,对高带信号分量的 时域振幅加入一个从O到l按对数曲线变化的时变渐入因子。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题在窄 带向宽带切换时,由于仅对宽带信号在时域进行时变渐入,并没有在频域进 行渐入处理,使得处理后的信号在频域上仍是突变的,因此当出现较窄带宽 向较宽带宽的切换时,人耳的实际听觉感受的舒适程度并不好。
技术实现思路
本专利技术实施例要解决的问题是提供一种音频信号的解码方法及装置,目 的是要改善语音信号在从较窄带宽向较宽带宽的切换时人耳感受的舒适度。为达到上述目的,本专利技术实施例的技术方案提供一种音频信号的解码方 法,包括当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行 切换时,获取所述音频信号的较低带信号分量和较高带分量信息;将所述较 高带分量信息进行频域整形,并获得较高带信号分量;将所述较高带信号分8量和所述较低带信号分量进行合成。本专利技术实施例的技术方案还提供了一种音频信号的解码装置,包括切 换检测单元,用于检测接收到的编码码流对应的音频信号是否由较窄带宽向较宽带宽进行切换;分量信息获取单元,用于当所述切换检测单元检测到接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;频域整形单元,用于将所 述分量信息获取单元获取的较高带分量信息进行频域整形,并获得较高带信 号分量;音频信号合成单元,用于将所述从频域整形单元获得的较高带信号 分量和所述信号分量信息获取获取的较低带信号分量进行合成。本专利技术实施例的技术方案还提供了 一种音频信号分量信息的频域整形方 法本文档来自技高网
...

【技术保护点】
一种音频信号的解码方法,其特征在于,包括: 当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息; 将所述较高带分量信息进行频域整形,并获得较高带信号分量; 将所 述较高带信号分量和所述较低带信号分量进行合成。

【技术特征摘要】
1、一种音频信号的解码方法,其特征在于,包括当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;将所述较高带分量信息进行频域整形,并获得较高带信号分量;将所述较高带信号分量和所述较低带信号分量进行合成。2、 如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带 分量信息进行频域整形具体包括利用时变的能量增益因子将所述较高带分量信息在时域进行整形,并将 时域整形后的较高带分量信息通过时变滤波器进行频域整形;或 对频域编码参数进行时变加权。3、 如权利要求1所述音频信号的解码方法,其特征在于,在所述获取音 频信号的较低带信号分量和较高带分量信息之后,还包括将所述较高带分 量信息在时域进行时变的渐入处理。4、 如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带 分量信息进行频域整形具体包括根据关键时刻的时变滤波器的极点和插值点数,获取n时刻的插值极点; 根据所述n时刻的插值极点,获取时变滤波器的转移函数; 根据所述转移函数,对过渡阶段的较高带分量信息进行时变滤波的渐入 处理。5、 如权利要求4所述音频信号的解码方法,其特征在于,所述n时刻的 插值极点由以下过程获取根据公式<formula>formula see original document page 2</formula>获取n时刻的插^f直才及点的实部; 根据公式<formula>formula see original document page 2</formula>获取n时刻的4i^f直才及点的虚部;根据公式= re/(w) + /wg()_/获取n时刻的4#ji才及点;其中,T (n)为n时刻的时变滤波器的插值极点,rel(n)为n时刻的所述 时变滤波器的插值极点的实部,rel(k)为关键时刻k的所述时变滤波器的极点 的实部,rel(m)为关键时刻m的所述时变滤波器的极点的实部,img(n)为n 时刻的所述时变滤波器的插值极点的虚部,img(k)为关4建时刻k的所述时变 滤波器的极点的虚部,img(m)为关键时刻m的所述时变滤波器的极点的虚 部,N为插值点^:。6、 如权利要求5所述音频信号的解码方法,其特征在于,所述转移函数<formula>formula see original document page 3</formula>获取;其中,rel(n)为n时刻的时变滤波器的插值极点的实部,img(n)为n时刻的所述时变滤波器的插值极点的虚部。7、 如权利要求4所述音频信号的解码方法,其特征在于,所述过渡阶段 为滤波计数器开始计数到结束计数的阶段,所述滤波计数器的计数由以下公 式确定<formula>formula see original document page 3</formula>其中,滤波计数器计数的起始值为0, x 为滤波计数器的计数值,」FMZ) — /iV — COMVT_M4X为过渡阶段持续采样点数。8、 如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带 分量信息进行频域整形具体包括将过渡阶段的较高带分量信息的每...

【专利技术属性】
技术研发人员:陈喆代金良杨磊张德明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1