检测音频信号的方法和装置制造方法及图纸

技术编号：16065091 阅读：40 留言：0更新日期：2017-08-22 17:13

本发明专利技术实施例提供检测音频信号的方法和装置，包括：确定输入的音频信号为待判断音频信号；确定该音频信号的增强分段信噪比SSNR，其中该增强SSNR大于基准SSNR；将该增强SSNR与语音活动检测VAD判决门限比较，确定该音频信号是否为活动信号。根据本发明专利技术实施例所提供的方法和装置能够准确地分辨活动语音和非活动语音。

Method and apparatus for detecting an audio signal

Including the embodiment of the invention provides a method and a device for audio signal detection, determining the input audio signal to determine the audio signal; determining enhanced segsnr SSNR of the audio signal, wherein the enhanced SSNR is greater than the reference SSNR; the comparison of SSNR and VAD enhanced voice activity detection threshold, determining whether the audio signal active signal. According to the embodiments of the present invention, the methods and apparatus provided can accurately distinguish active and inactive speech.

全部详细技术资料下载

【技术实现步骤摘要】
检测音频信号的方法和装置
本专利技术实施例涉及信号处理
，并且更具体地，涉及检测音频信号的方法和装置。
技术介绍
语音活动检测(VoiceActivityDetection,VAD)是一种广泛应用与语音通信、人机交互等领域的关键技术，VAD也可以被称为声音活动检测(SoundActivityDetection,SAD)。它的作用是检测输入的音频信号中是否有活动性信号，其中活动性信号是相对于非活动信号而言(例如环境背景噪音、静音等)。典型的活动信号包括语音、音乐等。VAD的原理是从输入的音频信号中提取一个或多个特征参数，根据这一个或多个特征参数确定一个或多个特征值，然后将这一个或多个特征值与一个或多个门限值进行比较。现有技术中的基于分段信噪比(SegmentalSignaltoNoiseRatio，SSNR)的活动信号检测方法是将输入的音频信号在频带上划分为多个子带信号，计算该音频信号在每一个子带的能量，通过将该音频信号在每一个子带的能量与一个估计出的背景噪声信号在每个子带的能量做对比，获得该音频信号在每个子带上的信噪比(Signal-to-NoiseRatio，SNR)。然后根据每个子带上的子带SNR确定SSNR，将SSNR与预设的VAD判决门限进行比较，如果该SSNR超过该VAD判决门限，则该音频信号为活动信号；如果该SSNR没有超过该VAD判决门限，则该音频信号为非活动信号。典型的一种计算SSNR的方法是将该音频信号所有子带SNR相加，得到的结果就是SSNR。例如，可以采用公式1.1确定SSNR：其中，k表示第k个子带，snr(k)表示第k个子带...
检测音频信号的方法和装置

【技术保护点】
一种检测音频信号的方法，其特征在于，包括：根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号，N为大于1的正整数；确定所述音频信号的增强SSNR，所述增强SSNR大于基准SSNR；将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。

【技术特征摘要】
1.一种检测音频信号的方法，其特征在于，包括：根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号，N为大于1的正整数；确定所述音频信号的增强SSNR，所述增强SSNR大于基准SSNR；将所述增强SSNR与语音活动检测VAD判决门限进行比较以确定所述音频信号是否为活动信号。2.如权利要求1所述的方法，其特征在于，所述根据由输入的音频信号的频谱划分的N个子带的子带SNR确定所述音频信号为待判断音频信号包括：在所述N个子带中子带SNR大于第一预设门限的高频端子带的数量大于第一数量的情况下，确定所述音频信号为所述待判断音频信号。3.如权利要求2所述的方法，其特征在于，所述确定所述音频信号的增强分段信噪比SSNR，包括：根据所述音频信号中各个子带的子带SNR的权重和各个子带的子带SNR，确定所述增强SSNR，其中，在所述N个子带中所述高频端子带的子带SNR的权重大于其他子带的子带SNR的权重。4.如权利要求2所述的方法，其特征在于，所述确定所述音频信号的增强分段信噪比SSNR，包括：确定所述音频信号的基准SSNR；根据所述音频信号的基准SSNR，确定所述增强SSNR。5.如权利要求2-4任一所述的方法，其特征在于，N＝20，所述20个子带由子带0至子带19组成，其中，子带18和所述子带19为所述高频端子带。6.如权利要求1-5任一所述的方法，其特征在...

【专利技术属性】
技术研发人员：王喆，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人