一种语音出现概率的计算方法、装置及电子设备制造方法及图纸

技术编号:15911593 阅读:44 留言:0更新日期:2017-08-01 22:51
本发明专利技术提供了一种语音出现概率的计算方法、装置及电子设备。本发明专利技术在语音出现概率计算中引入第一通道信号信噪比的度量参数和第一、第二通道之间信号功率电平差的度量参数,对上述度量参数进行归一化和非线性变换处理,并利用上述参数幂级数的一次项和乘积项拟合语音出现概率,从而可以减少了语音出现概率计算的运算量,使得计算结果对参数波动具有较好的健壮性,并能够广泛适用于各种双麦克风语音增强系统的应用场景。

Method, device and electronic equipment for calculating speech occurrence probability

The invention provides a method, a device and an electronic device for calculating the occurrence probability of speech sounds. The present invention appears into measurement parameters of the first channel signal to noise ratio measurement of signal power between the first and the second parameters and the channel level difference in the probability calculation in the speech, the measurement parameters were normalized and nonlinear transform, the probability of occurrence and the parameters of power series and a product fitting voice, which can reduce the the speech presence probability calculation computation, so the calculation results have good robustness to parameter fluctuations, and can be widely applied in various application scenarios enhanced dual microphone speech system.

【技术实现步骤摘要】
一种语音出现概率的计算方法、装置及电子设备
本专利技术涉及语音信号处理
,具体涉及一种语音出现概率的计算方法、装置及电子设备。
技术介绍
在正常的语音通话中,用户大约有50%的时间段是处于停顿/倾听等非发话状态。现行的语音增强系统则通过语音激活检测(VoiceActivityDetection,VAD)算法来鉴别出语音非激活段,并在该段进行环境噪声统计特性的估计与更新。目前的VAD技术大都通过计算语音信号时域波形的过零率或短时能量等参数、并将其与预定的阈值作相比,来做出语音激活与否的二元判决。但这种简单的二元判定方法时常发生误判(即把语音段判定为非语音段或者把非语音段判定为语音段),由此影响环境噪声统计参数估计的准确性,从而降低语音增强系统的质量。为克服VAD的这种局限性,人们提出了VAD的软判决技术。VAD软判决技术则首先计算语音出现概率(SpeechPresenceProbability,SPP)或者语音缺席概率(SpeechAbsenceProbability,SAP),然后再利用SPP或SAP来估计噪声的统计信息。然而,对于双麦克风语音增强系统,现有的计算语音出现概率的方法,大多存在计算量大,对参数波动敏感,以及在语音非激活段不趋近于零的缺点。
技术实现思路
本专利技术实施例要解决的技术问题是提供一种语音出现概率的计算方法、装置及电子设备,其计算复杂度较低,且对参数波动具有较好的健壮性,满足语音非激活段语音出现概率趋近于零的约束条件,能够广泛应用于各种双麦克风语音增强系统。为解决上述技术问题,本专利技术实施例提供的语音出现概率的计算方法,应用于采用端射End-fire结构设置的第一麦克风和第二麦克风,包括:根据第一麦克风拾取的第一通道的信号和第二麦克风拾取的第二通道的信号,计算第一度量参数和第二度量参数,所述第一度量参数为第一通道的信号信噪比,第二度量参数为第一通道与第二通道的信号功率电平差;对第一度量参数和第二度量参数,分别进行归一化和非线性变换处理,得到第三度量参数和第四度量参数;根据第三度量参数、第四度量参数以及预先确定的语音出现概率的计算公式,计算得到语音出现概率,其中,所述计算公式是通过对第三度量参数和第四度量参数的二元幂级数的一次项和乘积项进行拟合,并对拟合系数施加归一化约束后得到的。优选的,上述方案中,所述第一度量参数的计算包括:利用以下公式,计算第一度量参数:其中,MSNR(n,k)表示第一度量参数,ξ1(n,k)表示第一通道的第n帧信号第k个频率分量上的先验信噪比,ξ0(k)表示预先设定的第k个频率分量上的信噪比参考值。优选的,上述方案中,所述第二度量参数的计算包括:利用以下公式,计算第二度量参数:其中,MPLD(n,k)表示第二度量参数,表示第一通道的第n帧信号第k个频率分量上的信号功率谱密度,表示第二通道的第n帧信号第k个频率分量上的信号功率谱密度。优选的,上述方案中,所述归一化和非线性变换处理包括:对待处理参数进行数值更新,得到中间参数,其中,在数值超出区间[0,1]时,将数值更新为1,否则保持数值不变,所述待处理参数为第一度量参数或第二度量参数;对中间参数进行分段线性变换,得到最终参数,所述最终参数是所述中间参数的分段线性函数,且接近于所述中间参数取值范围中心的区段的斜率,大于远离所述中间参数取值范围中心的区段的斜率,所述最终参数为第三度量参数或第四度量参数。优选的,上述方案中,所述语音出现概率的计算公式为:P1=c(aM′SNR+(1-a)M′PLD)+(1-c)M′SNRM′PLD其中,P1表示第n帧信号第k个频率分量上的语音出现概率,M′SNR表示第三度量参数,M′PLD表示第四度量参数,a、c均为取值范围在[0,1]之内的拟合系数。优选的,上述方案中,所述拟合系数a、c的取值是预先设定的固定值。优选的,上述方案中,所述拟合系数a的取值是根据环境噪声的类型而预先设确定的;所述拟合系数c的取值,随着M′SNR与M′PLD的差值的减小而增大。其中,上述方案中,拟合系数c的取值,按照以下任一公式计算得到:c=1-|M′PLD-M′SNR|本专利技术实施例还提供了一种语音出现概率的计算装置,应用于采用端射End-fire结构设置的第一麦克风和第二麦克风,包括:采集单元,用于根据第一麦克风拾取的第一通道的信号和第二麦克风拾取的第二通道的信号,计算第一度量参数和第二度量参数,所述第一度量参数为第一通道的信号信噪比,第二度量参数为第一通道与第二通道的信号功率电平差;转换单元,用于对第一度量参数和第二度量参数,分别进行归一化和非线性变换处理,得到第三度量参数和第四度量参数;计算单元,用于根据第三度量参数、第四度量参数以及预先确定的语音出现概率的计算公式,计算得到语音出现概率,其中,所述计算公式是通过对第三度量参数和第四度量参数的二元幂级数的一次项和乘积项进行拟合,并对拟合系数施加归一化约束后得到的。优选的,上述方案中,所述采集单元,具体用于:利用以下公式,计算第一度量参数:其中,MSNR(n,k)表示第一度量参数,ξ1(n,k)表示第一通道的第n帧信号第k个频率分量上的先验信噪比,ξ0(k)表示预先设定的第k个频率分量上的信噪比参考值。优选的,上述方案中,所述采集单元,具体用于:利用以下公式,计算第二度量参数:其中,MPLD(n,k)表示第二度量参数,表示第一通道的第n帧信号第k个频率分量上的信号功率谱密度,表示第二通道的第n帧信号第k个频率分量上的信号功率谱密度。优选的,上述方案中,所述转换单元,具体用于:对待处理参数进行数值更新,得到中间参数,其中,在数值超出区间[0,1]时,将数值更新为1,否则保持数值不变,所述待处理参数为第一度量参数或第二度量参数;对中间参数进行分段线性变换,得到最终参数,所述最终参数是所述中间参数的分段线性函数,且接近于所述中间参数取值范围中心的区段的斜率,大于远离所述中间参数取值范围中心的区段的斜率,所述最终参数为第三度量参数或第四度量参数。优选的,上述方案中,所述语音出现概率的计算公式为:P1=c(aM′SNR+(1-a)M′PLD)+(1-c)M′SNRM′PLD其中,P1表示第n帧信号第k个频率分量上的语音出现概率,M′SNR表示第三度量参数,M′PLD表示第四度量参数,a、c均为取值范围在[0,1]之内的拟合系数。优选的,上述方案中,所述拟合系数a、c的取值是预先设定的固定值。优选的,上述方案中,所述拟合系数a的取值是根据环境噪声的类型而与确预先设定的;所述拟合系数c的取值,随着M′SNR与M′PLD的差值的减小而增大。其中,上述方案中,拟合系数c的取值,按照以下任一公式计算得到:c=1-|M′PLD-M′SNR|本专利技术实施例还提供了一种电子设备,包括:处理器;以及,通过总线接口与所述处理器相连接的存储器、第一麦克风和第二麦克风,所述第一麦克风和第二麦克风采用端射End-fire结构配置;所述存储器用于存储所述处理器在执行操作时所使用的程序和数据,当处理器调用并执行所述存储器中所存储的程序和数据时,实现如下的功能模块:采集单元,用于分别采集第一麦克风对应的第一通道和第一麦克风对应的第二通道的声音信号,计算第一度量参数和第二度量参数,其中,所本文档来自技高网...
一种语音出现概率的计算方法、装置及电子设备

【技术保护点】
一种语音出现概率的计算方法,应用于采用端射End‑fire结构设置的第一麦克风和第二麦克风,其特征在于,包括:根据第一麦克风拾取的第一通道的信号和第二麦克风拾取的第二通道的信号,计算第一度量参数和第二度量参数,所述第一度量参数为第一通道的信号信噪比,第二度量参数为第一通道与第二通道的信号功率电平差;对第一度量参数和第二度量参数,分别进行归一化和非线性变换处理,得到第三度量参数和第四度量参数;根据第三度量参数、第四度量参数以及预先确定的语音出现概率的计算公式,计算得到语音出现概率,其中,所述计算公式是通过对第三度量参数和第四度量参数的二元幂级数的一次项和乘积项进行拟合,并对拟合系数施加归一化约束后得到的。

【技术特征摘要】
1.一种语音出现概率的计算方法,应用于采用端射End-fire结构设置的第一麦克风和第二麦克风,其特征在于,包括:根据第一麦克风拾取的第一通道的信号和第二麦克风拾取的第二通道的信号,计算第一度量参数和第二度量参数,所述第一度量参数为第一通道的信号信噪比,第二度量参数为第一通道与第二通道的信号功率电平差;对第一度量参数和第二度量参数,分别进行归一化和非线性变换处理,得到第三度量参数和第四度量参数;根据第三度量参数、第四度量参数以及预先确定的语音出现概率的计算公式,计算得到语音出现概率,其中,所述计算公式是通过对第三度量参数和第四度量参数的二元幂级数的一次项和乘积项进行拟合,并对拟合系数施加归一化约束后得到的。2.如权利要求1所述的计算方法,其特征在于,所述第一度量参数的计算包括:利用以下公式,计算第一度量参数:其中,MSNR(n,k)表示第一度量参数,ξ1(n,k)表示第一通道的第n帧信号第k个频率分量上的先验信噪比,ξ0(k)表示预先设定的第k个频率分量上的信噪比参考值。3.如权利要求2所述的计算方法,其特征在于,所述第二度量参数的计算包括:利用以下公式,计算第二度量参数:其中,MPLD(n,k)表示第二度量参数,表示第一通道的第n帧信号第k个频率分量上的信号功率谱密度,表示第二通道的第n帧信号第k个频率分量上的信号功率谱密度。4.如权利要求3所述的计算方法,其特征在于,所述归一化和非线性变换处理包括:对待处理参数进行数值更新,得到中间参数,其中,在数值超出区间[0,1]时,将数值更新为1,否则保持数值不变,所述待处理参数为第一度量参数或第二度量参数;对中间参数进行分段线性变换,得到最终参数,所述最终参数是所述中间参数的分段线性函数,且接近于所述中间参数取值范围中心的区段的斜率,大于远离所述中间参数取值范围中心的区段的斜率,所述最终参数为第三度量参数或第四度量参数。5.如权利要求4所述的计算方法,其特征在于,所述语音出现概率的计算公式为:P1=c(aM′SNR+(1-α)M′PLD)+(1-c)M′SNRM′PLD其中,P1表示第n帧信号第k个频率分量上的语音出现概率,M′SNR表示第三度量参数,M′PLD表示第四度量参数,a、c均为取值范围在[0,1]之内的拟合系数。6.如权利要求5所述的计算方法,其特征在于,所述拟合系数a、c的取值是预先设定的固定值。7.如权利要求5所述的计算方法,其特征在于,所述拟合系数a的取值是根据环境噪声的类型而预先设确定的;所述拟合系数c的取值,随着M′SNR与M′PLD的差值的减小而增大。8.如权利要求7所述的计算方法,其特征在于,拟合系数c的取值,按照以下任一公式计算得到:c=1-|M′PLD-M′SNR|。9.一种语音出现概率的计算装置,应用于采用端射End-fire结构设置的第一麦克风和第二麦克风,其特征在于,包括:采集单元,用于根据第一麦克风拾取的第一通道的信号和第二麦克风拾取的第二通道的信号,计算第一度量参数和第二度量参数,所述第一度量参数为第一通道的信号信噪比,第二度量参数为第一通道与第二通道的信号功率电平差;转换单元,用于对第一度量参数和第二度量参数,分别进行归一化和非线性变换处理,得到第三度量参数和第四度量参数;计算单元,用于根据第三度量参数...

【专利技术属性】
技术研发人员:汪法兵梁民
申请(专利权)人:电信科学技术研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1