用于语音活动检测的检测器和方法技术

技术编号：11239060 阅读：63 留言：0更新日期：2015-04-01 12:31

本发明专利技术的实施例涉及语音活动检测器及其方法。所述语音活动检测器被配置为在接收到的输入信号中检测语音活动，所述语音活动检测器包括：输入部，被配置为接收来自所述VAD的初级语音检测器的指示初级VAD判决的信号以及来自至少一个外部VAD的指示来自所述至少一个外部VAD的语音活动判决的至少一个信号；处理器，被配置为将接收到的信号中指示的语音活动判决进行组合，以产生修改后的初级VAD判决；以及输出部，被配置为将修改后的初级VAD判决发送至所述VAD的尾响添加单元。

全部详细技术资料下载

【技术实现步骤摘要】
分案申请说明本申请是申请日为2010年10月18日、申请号为201080047231.8(国际申请号PCT/SE2010/051118)的、题为“用于语音活动检测的检测器和方法”的专利技术专利申请的分案申请。
本专利技术涉及语音活动检测方法和语音活动检测器，且更具体地涉及用于处理例如非平稳背景噪声的增强语音活动检测器。
技术介绍
在用于对话语音的语音编码系统中，通常使用非连续发送(DTX)来增加编码的效率。原因是对话语音包含了大量被嵌入语音中的停顿，例如当一个人在说话而另一个人在聆听时。因此在DTX的情况下，语音编码器平均仅在大约50％的时间上是活动的，且可以使用舒适噪声对其余时间进行编码。具有该特征的一些示例编解码是AMR NB(自适应多速率窄带)。对于高质量DTX操作，即，在没有劣化的语音质量的情况下，在输入信号中检测到语音的周期是重要的。这是通过语音活动检测器(VAD)来实现的。图1示出了一般VAD 180的整体框图，其获取根据具体实现被分为5至30ms的数据帧的输入信号100作为输入，并产生VAD判决作为输出160。即，VAD判决160是针对每帧的该帧是包含语音还是噪声的判决。通用VAD 180包括提供子带能量估计的背景估计器130以及提供特征子带能量的特征提取器120。对于每一帧，通用VAD计算特征，且为了识别活动帧，将当前帧的特征与该特征对于背景信号的“表现”的估...

【技术保护点】
一种在语音活动检测器VAD(199)中的用于在接收到的输入信号中检测语音活动的方法，包括：‑接收(1101)来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号，其中，所述初级语音活动判决是所述VAD的中间语音活动判决，‑接收来自至少一个外部VAD的、指示由所述至少一个外部VAD做出的语音活动判决的至少一个信号，‑对从所述初级语音活动检测器和所述至少一个外部VAD接收到的信号中指示的语音活动判决进行组合(1102)，以产生修改后的初级语音活动判决，以及‑将修改后的初级语音活动判决发送(1103)至所述VAD的尾响添加单元，所述尾响添加单元被配置为做出所述VAD的最终语音活动判决。

【技术特征摘要】
2009.10.19 US 61/252,858;2009.10.19 US 61/252,966;1.一种在语音活动检测器VAD(199)中的用于在接收到的输入
信号中检测语音活动的方法，包括：
-接收(1101)来自所述VAD的初级语音检测器的、指示由所述
初级语音检测器做出的初级语音活动判决的信号，其中，所述初级语
音活动判决是所述VAD的中间语音活动判决，
-接收来自至少一个外部VAD的、指示由所述至少一个外部VAD
做出的语音活动判决的至少一个信号，
-对从所述初级语音活动检测器和所述至少一个外部VAD接收
到的信号中指示的语音活动判决进行组合(1102)，以产生修改后的初
级语音活动判决，以及
-将修改后的初级语音活动判决发送(1103)至所述VAD的尾响
添加单元，所述尾响添加单元被配置为做出所述VAD的最终语音活
动判决。
2.根据权利要求1所述的方法，其中，通过逻辑“与”来组合接
收到的信号中的语音活动判决，使得仅在来自初级语音活动检测器的
信号和来自至少一个外部VAD的信号都指示语音的情况下，所述VAD
的修改后的初级语音活动判决才指示语音。
3.根据权利要求1所述的方法，其中，通过逻辑“或”来组合接
收到的信号中的语音活动判决，使得如果来自初级语音活动检测器的
信号和来自至少一个外部VAD的信号中的至少一个信号指示语音，
则所述VAD的修改后的初级语音活动判决就指示语音。
4.根据权利要求1至3中任一项所述的方法，其中，来自至少一
个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信
号是最终VAD判决。
5.根据权利要求1至3中任一项所述的方法，其中，来自至少一
个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信
号是初级语音活动判决。
6.根据权利要求1至5中任一项所述的方法，其中，所述至少一

\t个外部VAD是单个VAD。
7.根据权利要求1至5中任一项所述的方法，其中，所述至少一
个外部VAD是多个VAD。
8.根据权利要求1至7中任一项所述的方法，其中，根据输入信
号属性来组合语音活动判决。
9.根据权利要求8所述的方法，其中，所述输入信号属性包括以
下至少一项：估计出的信噪比；以及背景特性。
10.一种被配置为在接收到的输入信号中检测语音活动的语音活
动检测器VAD...

【专利技术属性】
技术研发人员：马丁·绍尔斯戴德，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典;SE

全部详细技术资料下载我是这个专利的主人