用于话音活动检测的方法和设备技术

技术编号：7901896 阅读：217 留言：0更新日期：2012-10-23 14:29

本发明专利技术提供一种话音活动检测设备(1)，其包括：信号条件分析单元(3)，其分析输入信号的至少一个信号参数，以检测所述输入信号的信号条件SC；至少两个话音活动检测单元(4-i)，其包括不同的话音检测特性，其中每一话音活动检测单元(4-i)单独执行对所述输入信号的话音活动检测，以提供话音活动检测决策VADD；以及决策组合单元(5)，其根据所述所检测到的信号条件SC而组合由所述话音活动检测单元(4-i)提供的所述话音活动检测决策VADD，以提供组合的话音活动检测决策cVADD。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

技术介绍
本专利技术涉及一种用于话音活动检测，且特别用于检测适用于例如编码器等音频信号处理单元处理的音频信号中有无人类语音的方法和设备。话音活动检测(VAD)总地来说是一种用来检测信号中的话音活动的技术。话音活动检测也被称为语音活动检测，或者简称为语音检测。话音活动检测可用于检测有无人类语音的语音应用中。话音活动检测可(例如)用于语音编码或语音识别中。由于话音活动检测与多种基于语音的应用相关，所以已开发了提供具有多样化特征并在例如时延、灵敏度、精确度以及计算复杂性等要求之间折衷的各种VAD算法。一些话音活动检测(VAD)算法还提供对数据的分析，例如所接收到的输入信号是有声的、无声的还是持续的。对包含输入信号帧的输入音频信号执行话音活动检测。可由话音活动检测单元来执行话音活动检测，所述话音活动检测单元用指示是否存在语音的对应标志来标记输入信号帧。常规的话音活动检测(VAD)设备的性能取决于所接收到的输入信号的具体条件以及相应的所接收信号的信号类型或信号类别。信号类型可包括语音信号、音乐信号以及具有背景噪声的语音信号。此外，信号的信号条件可变化，举例来说，所接收到的音频信号可具有较高的信噪比SNR或较低的信噪比SNR。在接收输入音频信号时，常规的话音活动检测设备可适合于所接收的输入信号，且可给出精确的(VAD)决策。然而，根据信号类别和信号条件，常规的话音活动检测器也可能产生不良结果，即在检测所施加的输入信号的话音活动时，所述检测器可能具有较低的话音检测精确度。而且，所施加的输入信号的信号条件和信号类型可随着时间而改变，且因此，常规话音活动检测设备对于信...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：阿里斯·塔勒布，王喆，许剑峰，苗磊，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人