信号编码方法及设备技术

技术编号:14232774 阅读:101 留言:0更新日期:2016-12-20 18:48
本发明专利技术实施例提供了信号编码方法及设备。该方法包括:在当前输入帧的前一帧的编码方式为连续编码方式的情况下,预测在当前输入帧被编码为SID帧的情况下解码器根据当前输入帧生成的舒适噪声,并确定实际静音信号,其中当前输入帧为静音帧;确定舒适噪声与实际静音信号的偏离程度;根据偏离程度,确定当前输入帧的编码方式,当前输入帧的编码方式包括拖尾帧编码方式或SID帧编码方式;根据当前输入帧的编码方式,对当前输入帧进行编码。本发明专利技术实施例中,通过根据舒适噪声与实际静音信号的偏离程度确定当前输入帧的编码方式为拖尾帧编码方式或SID帧编码方式,能够节省通信带宽。

Signal coding method and apparatus

The embodiment of the invention provides a signal coding method and a device. The method includes: in the current input before a frame encoding for encoding mode, the current input frame is predicted in the case of encoding to SID frame decoder according to the current input frame generating comfort noise, and determine the actual mute signal, the current input frame for the mute frame; determine the degree of deviation signal comfort noise and actual mute; according to the degree of deviation, determine the current input frame encoding, the encoding of the current input frame including the trailing frame encoding mode or SID frame encoding; according to the current input frame encoding, encoding of the current input frame. In the embodiment of the invention, the coding mode of the current input frame is determined by the deviation degree of the comfort noise and the actual mute signal, which is the tail frame coding mode or the SID frame coding mode.

【技术实现步骤摘要】

本专利技术涉及信号处理领域,并且具体地,涉及信号编码方法及设备
技术介绍
非连续传输系统(Discontinuous Transmission,DTX)是一种被广泛应用的语音通信系统,能够在语音通信的静音期间采用非连续的编码和传输语音帧的方式减少信道带宽的占用,同时仍能够保证足够的主观通话质量。语音信号通常可以分为两类,即活动语音信号和静音信号。活动语音信号是指包含有通话语音的信号,而静音信号则是指不含有通话语音的信号。在DTX系统中,对活动语音信号采用连续传输的方法进行传输,对静音信号采用非连续传输的方法进行传输。这种对静音信号的非连续传输,是通过编码端间歇地编码并发送一种叫静音描述帧(Silence Descriptor,SID)的特殊编码帧来实现的,两个相邻的SID帧之间DTX系统不会编码任何其它的信号帧。解码端根据非连续接收到的SID帧自主地生成令用户主观听觉舒适的噪声。这种舒适噪声(Comfort Noise,CN)并非以如实的还原原始静音信号为目的,而是为了满足解码端用户的主观听觉质量要求,不要有不适感。为了在解码端获得更好的主观听觉质量,由语音活动段到CN段的过渡质量是至关重要的。为了获得更平滑的过渡,一种有效的方法是:在由语音活动段过渡到静音段时,编码端不立即过渡到非连续传输状态,而是额外延迟一段时间。在这段时间内,静音段开头的部分静音帧仍然被视作语音活动帧连续的编码和发送,即设置一个连续传输的拖尾区间。这样做的好处是解码端可以充分地利用这段拖尾区间内的静音信号更好地估计和提取静音信号的特征,以生成更优的CN。但是,在现有技术中没有对拖尾机制进行高效的控制。拖尾机制的触发条件是比较简单的,即通过简单地统计在语音活动结束时是否有足够数量的语音活动帧被连续地编码和发送来确定是否触发拖尾机制,而触发拖尾机制后,固定长度的拖尾区间就会被强制执行。然而,并非有足够数量的语音活动帧被连续地编码和发送就一定需要执行固定长度的拖尾区间,例如在通信环境的背景噪声比较平稳时,即使不设置拖尾区间或设置较短的拖尾区间,解码端也能获得优质的CN。因此,这种对拖尾机制的简单控制模式造成了通信带宽的浪费。
技术实现思路
本专利技术实施例提供信号编码方法及设备,能够节省通信带宽。第一方面,提供了一种信号编码方法,包括:在当前输入帧的前一帧的编码方式为连续编码方式的情况下,预测在所述当前输入帧被编码为静音描述SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,其中所述当前输入帧为静音帧;确定所述舒适噪声与所述实际静音信号的偏离程度;根据所述偏离程度,确定所述当前输入帧的编码方式,所述当前输入帧的编码方式包括拖尾帧编码方式或SID帧编码方式;根据所述当前输入帧的编码方式,对所述当前输入帧进行编码。结合第一方面,在第一种可能的实现方式中,所述预测在所述当前输入帧被编码为SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,包括:预测所述舒适噪声的特征参数,并确定所述实际静音信号的特征参数,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数是一一对应的;所述确定所述舒适噪声与所述实际静音信号的偏离程度,包括:确定所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离。结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据所述偏离程度,确定所述当前输入帧的编码方式,包括:在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离小于阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离与所述阈值集合中的阈值是一一对应的;在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离大于或等于所述阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式。结合第一方面的第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述舒适噪声的特征参数用于表征以下至少一种信息:能量信息,谱信息。结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述能量信息包括码激励线性预测CELP激励能量;所述谱信息包括以下至少一种:线性预测滤波器系数,快速傅立叶变换FFT系数,修正离散余弦变换MDCT系数;所述线性预测滤波器系数包括以下至少一种:线谱频率LSF系数,线谱对LSP系数,导抗谱频率ISF系数,导谱对ISP系数,反射系数,线性预测编码LPC系数。结合第一方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,所述预测所述舒适噪声的特征参数,包括:根据所述当前输入帧的前一帧的舒适噪声参数和所述当前输入帧的特征参数,预测所述舒适噪声的特征参数;或者,根据所述当前输入帧之前的L个拖尾帧的特征参数和所述当前输入帧的特征参数,预测所述舒适噪声的特征参数,其中L为正整数。结合第一方面的第一种可能的实现方式至第五种可能的实现方式中任一实现方式,在第六种可能的实现方式中,所述确定所述实际静音信号的特征参数,包括:确定所述当前输入帧的特征参数作为所述实际静音信号的特征参数;或者,对M个静音帧的特征参数进行统计处理,以确定所述实际静音信号的特征参数。结合第一方面的第六种可能的实现方式,在第七种可能的实现方式中,所述M个静音帧包括所述当前输入帧以及所述当前输入帧之前的(M-1)个静音帧,M为正整数。结合第一方面的第二种可能的实现方式,在第八种可能的实现方式中,所述舒适噪声的特征参数包括所述舒适噪声的码激励线性预测CELP激励能量和所述舒适噪声的线谱频率LSF系数,所述实际静音信号的特征参数包括所述实际静音信号的CELP激励能量和所述实际静音信号的LSF系数;所述确定所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离,包括:确定所述舒适噪声的CELP激励能量与所述实际静音信号的CELP激励能量之间的距离De,并确定所述舒适噪声的LSF系数与所述实际静音信号的LSF系数之间的距离Dlsf。结合第一方面的第八种可能的实现方式,在第九种可能的实现方式中,所述在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离小于阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式,包括:在所述距离De小于第一阈值,且所述距离Dlsf小于第二阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式;所述在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离大于或等于所述阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式,包括:在所述距离De大于或等于第一阈值,或者所述距离Dlsf大于或等于第二阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式。结合第一方面的第九种可能的实现方式,在第十种可能的实现方式中,还包括:获取预设的所述第一阈值和预设的所述第二阈值;或者,根据所述当前输入帧之前的N个静音帧的CELP激励能量确定所述第一阈值,并根据所述N个静音帧的LSF系数确定所述第二阈值,其中N为正整数。结合第一方面或第一方面的第一种可能的实现方式至第本文档来自技高网
...
信号编码方法及设备

【技术保护点】
一种确定编码方式的方法,其特征在于,包括:在当前输入帧的前一帧的编码方式为连续编码方式的情况下,预测在所述当前输入帧被编码为静音描述SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,其中所述当前输入帧为静音帧;确定所述舒适噪声与所述实际静音信号的偏离程度;根据所述偏离程度确定所述当前输入帧的编码方式为SID帧编码方式。

【技术特征摘要】
1.一种确定编码方式的方法,其特征在于,包括:在当前输入帧的前一帧的编码方式为连续编码方式的情况下,预测在所述当前输入帧被编码为静音描述SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,其中所述当前输入帧为静音帧;确定所述舒适噪声与所述实际静音信号的偏离程度;根据所述偏离程度确定所述当前输入帧的编码方式为SID帧编码方式。2.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述偏离程度确定所述当前输入帧的编码方式为拖尾帧编码方式。3.根据权利要求2所述的方法,其特征在于,所述预测在所述当前输入帧被编码为SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,包括:预测所述舒适噪声的特征参数,并确定所述实际静音信号的特征参数,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数是一一对应的;所述确定所述舒适噪声与所述实际静音信号的偏离程度,包括:确定所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离。4.根据权利要求3所述的方法,其特征在于,所述根据所述偏离程度确定所述当前输入帧的编码方式为SID帧编码方式,包括:在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离小于阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离与所述阈值集合中的阈值是一一对应的。5.如权利要求3所述的方法,其特征在于,所述根据所述偏离程度确定所述当前输入帧的编码方式为拖尾帧编码方式,包括:在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离大于或等于所述阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式。6.根据权利要求3至5中任一所述的方法,其特征在于,所述舒适噪声的特征参数用于表征以下至少一种信息:能量信息,谱信息。7.根据权利要求6所述的方法,其特征在于,所述能量信息包括码激励线性预测CELP激励能量;所述谱信息包括以下至少一种:线性预测滤波器系数,快速傅立叶变换FFT系数,修正离散余弦变换MDCT系数;所述线性预测滤波器系数包括以下至少一种:线谱频率LSF系数,线谱对LSP系数,导抗谱频率ISF系数,导谱对ISP系数,反射系数,线性预测编码LPC系数。8.根据权利要求3至7中任一项所述的方法,其特征在于,所述预测所述舒适噪声的特征参数,包括:根据所述当前输入帧的前一帧的舒适噪声参数和所述当前输入帧的特征参数,预测所述舒适噪声的特征参数;或者,根据所述当前输入帧之前的L个拖尾帧的特征参数和所述当前输入帧的特征参数,预测所述舒适噪声的特征参数,其中L为正整数。9.根据权利要求3至8中任一项所述的方法,其特征在于,所述确定所述实际静音信号的特征参数,包括:将所述当前输入帧的特征参数作为所述实际静音信号的特征参数;或者,对M个静音帧的特征参数进行统计处理,以确定所述实际静音信号的特征参数。10.根据权利要求9所述的方法,其特征在于,所述M个静音帧包括所述当前输入帧以及所述当前输入帧之前的(M-1)个静音帧,M为正整数。11.根据权利要求4所述的方法,其特征在于,所述舒适噪声的特征参数包括所述舒适噪声的码激励线性预测CELP激励能量和所述舒适噪声的线谱频率LSF系数,所述实际静音信号的特征参数包括所述实际静音信号的CELP激励能量和所述实际静音信号的LSF系数;所述确定所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离,包括:确定所述舒适噪声的CELP激励能量与所述实际静音信号的CELP激励能量之间的距离De,并确定所述舒适噪声的LSF系数与所述实际静音信号的LSF系数之间的距离Dlsf。12.根据权利要求11所述的方法,其特征在于,所述在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离小于阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式,包括:在所述距离De小于第一阈值,且所述距离Dlsf小于第二阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式;所述在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离大于或等于所述阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式,包括:在所述距离De大于或等于第一阈值,或者所述距离Dlsf大于或等于第二阈值的情况下,确定所述当前输入帧...

【专利技术属性】
技术研发人员:王喆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1