检测话音活动的方法及用于实现该方法的话音信号编码器技术

技术编号:3047096 阅读:177 留言:0更新日期:2012-04-11 18:40
一种在信号中检测话音活动的方法,对“话音”或“噪音”决定进行平滑以避免话音段的丢失。本方法特别适用于噪音电平高的情况。不同于现有技术方法着重对通信的优化,本方法着重于解码后再生信号的清晰度。待编码信号被分割为若干帧。对每一个信号帧做一“话音”或“噪音”的最初决定。本方法当有一帧的信号强度高于前一帧的强度时,即使这种增长是为微弱的,也会做出“话音”决定。本方法只有当信号特征至少有i个连续帧(比如i=6)符合噪音特征时才会做出“噪音”决定。本方法可用于电话通信。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种包含一改进的话音活动检测器的话音信号编码器,特别是一种符合ITU-T标准G.729A,附件B的编码器。
技术介绍
一话音信号包含多至60%的静音或背景噪音。为了减少待传输的信息数量,在已知的先有技术中,区分包含确实所需信号的话音信号部分及只包含静音或噪音部分,并且使用各自不同的软件算法对它们进行编码,每个只包含静音或噪音的部分由很少的代表背景噪音特征的信息编码。此类编码器包含一话音活动检测器,其依照频谱特征及待编码的话音信号的能量(对每一信号帧计算)来进行区分。话音信号被分割为对应于比如持续时间为10毫秒的数字帧,对每个帧来说,一系列参数从信号中取出。主要的参数是自相关系数。一系列线性预测编码系数及一系列频率参数就从自相关系数中推导出。区别真正包含所需信号的话音信号部分和只包含静音或噪音部分的方法的一步将信号的一帧的能量和一阈值作比较。一个用来计算阈值的装置根据噪音的变化来调整阈值。影响话音信号的噪音包含电气噪音和背景噪音。背景噪音会在通话过程中有显著的增加或减少。而且,噪音频率滤波系数也必须调整以适应噪音的变化。“ITU-T建议G729附件B一个为V.70数字同步话音及数据应用而优化的与G729一起使用的无声压缩计划”,作者Adil Benyassine等,1997年9月登载于IEEE通信杂志,描述了一种上述类型的编码器。解码已编话音信号的解码器必须交替使用两个分别对应于被编码为话音的信号部分和被编码为静音或背景噪音的信号部分的解码器算法。由一个算法到另一算法的变化由编码静音或噪音周期的信息进行同步。执行ITU-T标准G.729A,附件B,11/96的先有技术编码,若噪音水平超过标准所规定的量化等级8000级,则不再能够区分一个所需信号和噪音。这导致对话音活动检测信号及对所需信号部分的损耗的许多不必要的转换。在文献G.723.1 VAD中所描述的一个先有技术方案中,当信噪比低于一预定值时,在编码器中完全抑制话音活动检测。此种解决方案保留了所需信号的完整性却具有增加通信量的缺点。本专利技术的目的是提出一种更有效的方案,在通信量方面它保留了话音活动检测的效率,却没有降低解码后再生信号的质量。
技术实现思路
本专利技术包括一种检测被分割为帧的信号中的话音活动的方法,本方法包括对每一帧所作“话音”或“噪音”最初决定的平滑步骤,这一平滑步骤包含为帧n作一“话音”最终决定的步骤,如果-对帧n的最初决定为“话音”;并且-对帧n-2的最终决定为“噪音”;并且-帧n-1的能量比帧n-2的大;并且-帧n的能量比帧n-2的大。上述方法避免了当能量只在帧n期间瞬间增长时从“噪音”到“话音”的不需要的转变,因为平滑功能将为帧n之前的帧n-1所作的最终决定考虑在内,从而决定从“噪音”到“话音”的转变。在一个本专利技术的优选实施例中,若对帧n作一“话音”最终决定,根据本专利技术的方法可进一步防止任何从帧n+1到帧n+i的“噪音”最终决定,在这里i是一个定义惯性周期的整数。上述方法避免了丢失语音段的现象,因为平滑功能对于返回“噪音”决定有一个相当于持续i帧的一个惯性。本专利技术进一步包括一个话音信号编码器,其包含为实现根据本专利技术的方法的平滑装置。本专利技术及其其它一些特征将由下述描述及附图变得更加易懂。附图说明图1为一实现根据本专利技术的方法的一个编码器的实施例的功能框图。图2示出了标准G.729,附件6,11/96所揭示的编码方法的“话音/噪音”决定流程图。图3更详细地示出了标准G.729,附件6,11/96所揭示的编码方法中平滑话音活动检测信号的操作。图4示出了根据本专利技术的方法一个实施例中平滑话音活动检测信号的流程图。图5示出了对于不同信噪比,先有技术以及根据本专利技术的方法的错误百分率。图6示出了对于不同信噪比,先有技术以及根据本专利技术的方法的话音丢失百分率。具体实施例方式图1所显示的一编码器的实施例的功能框图包括一一个接收待编码的模拟话音信号的输入1;一一个用来滤波,采样及量化该话音信号并构造帧的电路2;一一个转换开关3,其具有一与电路2的输出端相连的输入端和两个输出端;一一电路4,用来对代表一所需信号的帧进行编码,以及具有一连至转换开关3的第一输出端的一输入端;一一电路5,用来对代表静音或噪音信号的帧进行编码,以及具有一连至转换开关3的第二输出端的一输入端;一第二转换开关6,具有分别接至电路4和电路5的一个输出端的第一和第二输入端,一输出端8构成了编码器的输出端,以及一一话音活动检测器7,其具有与电路2的输出相连的一输入端,特别接至转换开关3和6的每一个的控制输入端的一输出端,以便选择相应于话音信号所需信号或静音(或噪音)已识别出的内容的被编码的帧。当话音信号是所需信号时,编码器每10毫秒产生一帧。当话音信号包含静音(或噪音)时,编码器于静音(或噪音)周期之始产生一个单帧。实际上,可以通过对一处理器编程而实现上述类型的编码器。特别地,根据本专利技术的方法可由软件实现,且其实现相对于本领域的技术人员来说是显然的。图2显示了通过由标准G.729附件B,11/96已知的编码方法确定“话音”或“噪音”的流程图。此方法适用于固定持续时间为10毫秒的数字信号帧。第一步11为当前待编码的信号的帧取出四个参数即该帧在整个频带内的能量,其在低频的能量,一系列频谱系数,以及零交叉率。下一步12更新缓冲存储器的最小容量。下一步13将当前帧的个数与预定的Ni值相比较一若当前帧的个数少于Ni--下一步14初始化待编码的信号的参数中的滑动平均值频谱系数,整个频带的平均能量,低频的平均能量,以及平均零交叉率。--下一步15将该帧的能量与预定的阈值相比,并且若该帧的能量大于该值则此信号为话音信号,或者若该帧的能量小于该值则该信号为噪音信号。当前帧的处理结束于第16步。--若当前帧的数目不小于Ni,则下一步17决定其是等于还是大于Ni--如果等于Ni,则下一步18初始化整个频带噪声的平均能量值以及低频噪声的平均能量值。--如果大于Ni--下一步19通过从该帧参数的滑动平均值中减去帧参数当前值计算出一系列差分参数,后者代表噪音。这些差分参数为频谱失真,整个频带能量差,低频能量差,零交差率差。--下一步20将此帧的能量与一预定的阈值相比--若其不小于此值,则步骤21在多个标准的基础上作一“话音”或“噪音”的初始决定,然后步骤22“平滑”此决定以避免太多的决定的改变。--若其小于或等于此值,则步骤23决定信号为噪音,然后步骤22“平滑”该决定。--整理步骤22之后,下一步24将当前帧的能量与一等于整个频带内能量的滑动平均值加一常数的自适应阈值相比较--若其大于阈值,则下一步25更新代表噪音的参数的滑动平均值,然后当前帧的处理结束于步骤26。--若其不大于阈值,则当前帧的处理结束于步骤27。图3更详细地示出了由标准G.729附件B中11/96所知的编码方法的话音活动检测信号整理操作。此整理过程包括四步,其接着基于多个标准的“话音”或“噪音”的初始决定21--第一步31做出“话音”的决定,如果--对在前帧所做决定为“话音”,且--当前帧的平均能量大于先前帧的能量的滑动平均值加一常数,换言之,当前帧的能量的确大于噪音的平均能量。否则,做出“噪音”的最终决定42。--第2步骤3本文档来自技高网
...

【技术保护点】
一种用于在分割为帧的信号中检测话音活动的方法,所述方法包括平滑对每一帧所作的“话音”或“噪音”初始决定的步骤,所述平滑步骤包含对某帧n作一“话音”最终决定的步骤,如果: -对帧n的初始决定为“话音”;而且 -对帧n-2的最终决定为“噪音”;而且 -帧n-1的能量大于帧n-2的能量;而且 -帧n的能量大于帧n-2的能量。

【技术特征摘要】
FR 2001-6-11 01075851.一种用于在分割为帧的信号中检测话音活动的方法,所述方法包括平滑对每一帧所作的“话音”或“噪音”初始决定的步骤,所述平滑步骤包含对某帧n作一“话音”最终决定的步骤,如果-对帧n的初始决定为“话音”;而且-对帧n-2的最终决定为“噪音”;而且-帧n-1的能量大于帧n-2的能量;而且-帧n的能量大于帧n-2的能量。2.根据权利要求1所述的方法,其中,若已对帧n作了一“话音”最终决定则禁止从帧n+1到帧n+i的“噪音”的最终决定,其中i是一个定义惯性周期的整数。3.根据权利要求1所述的方法,其中所述平滑步骤包含对帧n的步骤-如果初始决定为“话音”,则将一惯性计数器复位为0;-如果初始决定为“噪音”,则确定帧n的能量是否大于一阈值,且所述惯性计数器的值是否小于一个固定的阈值并大于1,然后---当三个条件都满足时作出“话音”决定,并且将所述惯性计数器的值加1;---或者,当任一条件不满足时作出“噪音”决定。4...

【专利技术属性】
技术研发人员:雷蒙德加塞理查德亚特曾霍佛
申请(专利权)人:阿尔卡塔尔公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1