检测音频信号的方法和装置制造方法及图纸

技术编号:16065091 阅读:40 留言:0更新日期:2017-08-22 17:13
本发明专利技术实施例提供检测音频信号的方法和装置,包括:确定输入的音频信号为待判断音频信号;确定该音频信号的增强分段信噪比SSNR,其中该增强SSNR大于基准SSNR;将该增强SSNR与语音活动检测VAD判决门限比较,确定该音频信号是否为活动信号。根据本发明专利技术实施例所提供的方法和装置能够准确地分辨活动语音和非活动语音。

Method and apparatus for detecting an audio signal

Including the embodiment of the invention provides a method and a device for audio signal detection, determining the input audio signal to determine the audio signal; determining enhanced segsnr SSNR of the audio signal, wherein the enhanced SSNR is greater than the reference SSNR; the comparison of SSNR and VAD enhanced voice activity detection threshold, determining whether the audio signal active signal. According to the embodiments of the present invention, the methods and apparatus provided can accurately distinguish active and inactive speech.

【技术实现步骤摘要】
检测音频信号的方法和装置
本专利技术实施例涉及信号处理
,并且更具体地,涉及检测音频信号的方法和装置。
技术介绍
语音活动检测(VoiceActivityDetection,VAD)是一种广泛应用与语音通信、人机交互等领域的关键技术,VAD也可以被称为声音活动检测(SoundActivityDetection,SAD)。它的作用是检测输入的音频信号中是否有活动性信号,其中活动性信号是相对于非活动信号而言(例如环境背景噪音、静音等)。典型的活动信号包括语音、音乐等。VAD的原理是从输入的音频信号中提取一个或多个特征参数,根据这一个或多个特征参数确定一个或多个特征值,然后将这一个或多个特征值与一个或多个门限值进行比较。现有技术中的基于分段信噪比(SegmentalSignaltoNoiseRatio,SSNR)的活动信号检测方法是将输入的音频信号在频带上划分为多个子带信号,计算该音频信号在每一个子带的能量,通过将该音频信号在每一个子带的能量与一个估计出的背景噪声信号在每个子带的能量做对比,获得该音频信号在每个子带上的信噪比(Signal-to-NoiseRatio,SNR)。然后根据每个子带上的子带SNR确定SSNR,将SSNR与预设的VAD判决门限进行比较,如果该SSNR超过该VAD判决门限,则该音频信号为活动信号;如果该SSNR没有超过该VAD判决门限,则该音频信号为非活动信号。典型的一种计算SSNR的方法是将该音频信号所有子带SNR相加,得到的结果就是SSNR。例如,可以采用公式1.1确定SSNR:其中,k表示第k个子带,snr(k)表示第k个子带的子带SNR,N表示该音频信号总共被划分为子带的子带个数。通过上述计算SSNR的方法检测活动语音时,可能会造成活动语音的漏检。
技术实现思路
本专利技术实施例提供了检测音频信号的方法和装置,能够准确地分辨活动语音和非活动语音。第一方面,本专利技术实施例提供一种检测音频信号的方法,该方法包括:根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号,N为大于1的正整数;确定所述音频信号的增强SSNR,所述增强SSNR大于基准SSNR;将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。结合第一方面,在第一方面的第一种可能的实现方式中,所述根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号包括:在所述N个子带中子带SNR大于第一预设门限的高频端子带的数量大于第一数量的情况下,确定所述音频信号为所述待判断音频信号。结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述确定所述音频信号的增强分段信噪比SSNR,包括:根据所述音频信号中各个子带的子带SNR的权重和各个子带的子带SNR,确定所述增强SSNR,其中,在所述N个子带中所述高频端子带的子带SNR的权重大于其他子带的子带SNR的权重。结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述确定所述音频信号的增强分段信噪比SSNR,包括:确定所述音频信号的基准SSNR;根据所述音频信号的基准SSNR,确定所述增强SSNR。结合第一方面的上述任何一种实现方式,在第一方面的又一种实现方式中,N=20,所述20个子带由子带0至子带19组成,其中,子带18和所述子带19为所述高频端子带。结合第一方面或第一方面的上述任何一种实现方式,在第一方面的又一种实现方式中,所述待判断音频信号为清音信号。结合第二方面,本专利技术实施例提供一种装置,包括:第一确定单元,用于根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号,N为大于1的正整数;第二确定单元,用于确定所述音频信号的增强SSNR,所述增强SSNR大于基准SSNR;第三确定单元,用于将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。结合第二方面,在第二方面的第一种可能的实现方式中,所述第一确定单元,具体用于在所述N个子带中子带SNR大于第一预设门限的高频端子带的数量大于第一数量的情况下,确定所述音频信号为所述待判断音频信号。结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第二确定单元,具体用于根据所述音频信号中各个子带的子带SNR的权重和各个子带的子带SNR,确定所述增强SSNR,其中,在所述N个子带中所述高频端子带的子带SNR的权重大于其他子带的子带SNR的权重。结合第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述第二确定单元,具体用于确定所述音频信号的基准SSNR,以及根据所述音频信号的基准SSNR确定所述增强SSNR。结合第二方面的上述任何一种实现方式,在第二方面的又一种实现方式中,N=20,所述20个子带由子带0至子带19组成,其中,子带18和所述子带19为所述高频端子带。结合第二方面或第二方面的上述任何一种实现方式,在第二方面的又一种实现方式中,所述待判断音频信号为清音信号。根据本专利技术实施例所提供的方法,可以确定音频信号的特征,根据音频信号的特征,采用相应的方式确定增强SSNR,并采用该增强SSNR与VAD判决门限进行比较,这样可以使得活动信号被漏检比例降低。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例提供的检测音频信号的方法的示意性流程图。图2是根据本专利技术实施例提供的检测音频信号的方法的示意性流程图。图3是根据本专利技术实施例提供的检测音频信号的方法的示意性流程图。图4是根据本专利技术实施例提供的检测音频信号的方法的示意性流程图。图5是根据本专利技术实施例提供的装置的结构框图。图6是根据本专利技术实施例提供的另一装置的结构框图。图7是根据本专利技术实施例提供的装置的结构框图。图8是根据本专利技术实施例提供的另一装置的结构框图。图9是根据本专利技术实施例提供的另一装置的结构框图。图10是根据本专利技术实施例提供的另一装置的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。图1是根据本专利技术实施例提供的检测音频信号的方法的示意性流程图。101,确定输入的音频信号为待判断音频信号。102,确定该音频信号的增强SSNR,其中该增强SSNR大于基准SSNR。103,将该增强SSNR与VAD判决门限比较,确定该音频信号是否为活动信号。在本专利技术的实施例中,在将增强SSNR与VAD判决门限进行比较时,可以使用基准VAD判决门限,也可以使用预置算法减小基准VAD判决门限后获得的减小后的VAD判决门限。其中,基准VAD判决门限可以是默认的VAD判决门限,该基准VAD判决门限可以是预先存储的,也可以是临时计算获得,本文档来自技高网
...
检测音频信号的方法和装置

【技术保护点】
一种检测音频信号的方法,其特征在于,包括:根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号,N为大于1的正整数;确定所述音频信号的增强SSNR,所述增强SSNR大于基准SSNR;将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。

【技术特征摘要】
1.一种检测音频信号的方法,其特征在于,包括:根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号,N为大于1的正整数;确定所述音频信号的增强SSNR,所述增强SSNR大于基准SSNR;将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。2.如权利要求1所述的方法,其特征在于,所述根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号包括:在所述N个子带中子带SNR大于第一预设门限的高频端子带的数量大于第一数量的情况下,确定所述音频信号为所述待判断音频信号。3.如权利要求2所述的方法,其特征在于,所述确定所述音频信号的增强分段信噪比SSNR,包括:根据所述音频信号中各个子带的子带SNR的权重和各个子带的子带SNR,确定所述增强SSNR,其中,在所述N个子带中所述高频端子带的子带SNR的权重大于其他子带的子带SNR的权重。4.如权利要求2所述的方法,其特征在于,所述确定所述音频信号的增强分段信噪比SSNR,包括:确定所述音频信号的基准SSNR;根据所述音频信号的基准SSNR,确定所述增强SSNR。5.如权利要求2-4任一所述的方法,其特征在于,N=20,所述20个子带由子带0至子带19组成,其中,子带18和所述子带19为所述高频端子带。6.如权利要求1-5任一所述的方法,其特征在...

【专利技术属性】
技术研发人员:王喆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1