【技术实现步骤摘要】
一种语音去混响的方法及装置
本专利技术涉及语音信号处理
,特别涉及一种语音去混响的方法及装置。
技术介绍
语音信号在室内会发生混响效应,这一混响的语音通常严重地降低了通信系统中语音可懂度和自动语音识别系统(ASR)中语音正确识别率。对于现有的去混响技术均有各自的技术缺陷,尤其是在利用离线WPE进行语音处理时,其不能实时处理语音信号、计算量较大、易受噪声影响,无法改善和提高语音通信系统和ASR的性能。
技术实现思路
本专利技术实施例提供一种语音去混响的方法及装置,以解决在利用离线WPE进行语音处理时,因不能实时处理语音信号、计算量较大、易受噪声影响,无法改善和提高语音通信系统和ASR的性能。为了解决上述技术问题,本专利技术实施例提供一种语音去混响的方法,包括:获取麦克风阵列捕获的每帧语音信号的频谱矢量;根据所述每帧语音信号的频谱矢量,分别获取检测结果为语音的信号帧的第一频点以及检测结果为非语音的信号帧的第二频点;获取所述第一频点中每一频点处的频谱的去混响后的第一语音信号频谱矢量,并根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新;获取第二 ...
【技术保护点】
1.一种语音去混响的方法,其特征在于,包括:获取麦克风阵列捕获的每帧语音信号的频谱矢量;根据所述每帧语音信号的频谱矢量,分别获取检测结果为语音的信号帧的第一频点以及检测结果为非语音的信号帧的第二频点;获取所述第一频点中每一频点处的频谱的去混响后的第一语音信号频谱矢量,并根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新;获取第二频点中每一频点的频谱进行衰减后的非语音信号频谱矢量;根据所述第一语音信号频谱矢量和非语音信号频谱矢量,获取去混响语音信号。
【技术特征摘要】
1.一种语音去混响的方法,其特征在于,包括:获取麦克风阵列捕获的每帧语音信号的频谱矢量;根据所述每帧语音信号的频谱矢量,分别获取检测结果为语音的信号帧的第一频点以及检测结果为非语音的信号帧的第二频点;获取所述第一频点中每一频点处的频谱的去混响后的第一语音信号频谱矢量,并根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新;获取第二频点中每一频点的频谱进行衰减后的非语音信号频谱矢量;根据所述第一语音信号频谱矢量和非语音信号频谱矢量,获取去混响语音信号。2.根据权利要求1所述的语音去混响的方法,其特征在于,所述获取麦克风阵列捕获的每帧语音信号的频谱矢量的步骤,包括:获取麦克风阵列实时捕获的语音信号;对每一帧语音信号进行频谱计算,得到麦克风阵列捕获的每帧语音信号的频谱矢量。3.根据权利要求1所述的语音去混响的方法,其特征在于,所述根据所述每帧语音信号的频谱矢量,分别获取检测结果为语音的信号帧的第一频点以及检测结果为非语音的信号帧的第二频点的步骤,包括:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方;在所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比小于第一门限参数,且所述当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方大于第二门限参数时,将当前帧语音信号在预设频点处标记为语音;或在所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比大于或等于第一门限参数,或所述当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量的幅值平方相干系数小于或等于第二门限参数时,将当前帧语音信号在预设频点处标记为噪音。4.根据权利要求3所述的语音去混响的方法,其特征在于,所述获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比的步骤,包括:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差;根据所述香农熵值和所述香农熵值的方差,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比。5.根据权利要求4所述的语音去混响的方法,其特征在于,所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的获取方式为:获取检测频点处的每帧语音信号的频谱矢量的幅值权重;根据所述幅值权重,获取每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值;根据所述每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值。6.根据权利要求5所述的语音去混响的方法,其特征在于,所述获取检测频点处的每帧语音信号的频谱矢量的幅值权重的步骤,包括:根据公式:获取幅值权重;其中,pn,m[k]为第k帧第m个频点处的语音信号的频谱矢量的幅值权重;yn,m[k]为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。7.根据权利要求5所述的语音去混响的方法,其特征在于,所述根据所述幅值权重,获取每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值的步骤,包括:根据公式:获取每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值;其中,Hn,Y[k]为第k帧第n个麦克风捕获的语音信号的频谱矢量的香农熵值;pn,m[k]为第k帧第m个频点处的语音信号的频谱矢量的幅值权重;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。8.根据权利要求5所述的语音去混响的方法,其特征在于,所述根据所述每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的步骤,包括:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;其中,HY[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;Hn,Y[k]为第k帧第n个麦克风捕获的语音信号的频谱矢量的香农熵值;n=1,2,…,N,且N为捕获语音信号的麦克风总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。9.根据权利要求4所述的语音去混响的方法,其特征在于,所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差的获取方式为:根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值,获取所述香农熵值的均值;根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值以及所述香农熵值的均值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差。10.根据权利要求9所述的语音去混响的方法,其特征在于,所述根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值,获取所述香农熵值的均值的步骤,包括:根据公式:μH[k]=λ·μH[k-1]+(1-λ)·HY[k]获取香农熵值的均值;其中,μH[k]为第k帧语音信号的频谱矢量的香农熵值的均值;HY[k]为麦克风阵列捕获的第k帧语音信号的频谱矢量的香农熵值;μH[k-1]为第k-1帧语音信号的频谱矢量的香农熵值的均值;λ为平滑系数,且0<λ<1;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。11.根据权利要求9所述的语音去混响的方法,其特征在于,所述根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值以及所述香农熵值的均值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差的步骤,包括:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差;其中,为第k帧麦克风阵列信号谱矢量的香农熵值的方差;为第k-1帧麦克风阵列信号谱矢量的香农熵值的方差;μH[k]为第k帧语音信号的频谱矢量的香农熵值的均值;HY[k]为麦克风阵列捕获的第k帧语音信号的频谱矢量的香农熵值;λ为平滑系数,且0<λ<1;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。12.根据权利要求4所述的语音去混响的方法,其特征在于,所述根据所述香农熵值和所述香农熵值的方差,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比的步骤,包括:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;其中,C1[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;HY[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;为第k帧麦克风阵列信号谱矢量的香农熵值的方差;k为信号帧索引变量,k=1,2,…,K,且K为总信号帧数。13.根据权利要求3所述的语音去混响的方法,其特征在于,所述获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方的步骤,包括:获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数;根据所述相干系数,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方。14.根据权利要求13所述的语音去混响的方法,其特征在于,所述获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数的步骤,包括:获取麦克风阵列捕获的当前帧语音信号的频谱矢量在预设频点处的谱线的方差和及当前帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差;根据所述方差和及所述协方差,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数。15.根据权利要求14所述的语音去混响的方法,其特征在于,所述麦克风阵列捕获的当前帧语音信号的频谱矢量在预设频点处的谱线的方差和的获取方式为:根据公式:获取方差和;其中,为麦克风阵列捕获的语音信号的第k帧第m个频点的谱线的方差和;为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线的方差;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。16.根据权利要求15所述的语音去混响的方法,其特征在于,所述第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线的方差的获取方式为:根据公式:获取第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线的方差;其中,为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线的方差;为第n个麦克风接收信号的第k-1帧快速傅氏变换中第m个频点的谱线的方差;yn,m[k]*为yn,m[k]的共轭;yn,m[k]为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数;λ为平滑系数,且0<λ<1。17.根据权利要求14所述的语音去混响的方法,其特征在于,所述当前帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差的获取方式为:根据公式:Δn,m[k]=λ·Δn,m[k-1]+(1-λ)·{yn,m[k]yn,m[k-1]*}获取协方差;其中,Δn,m[k]为当前帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差;Δn,m[k-1]为第k-1帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差;yn,m[k-1]*为yn,m[k-1]的共轭;yn,m[k]为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数;λ为平滑系数,且0<λ<1。18.根据权利要求14所述的语音去混响的方法,其特征在于,所述根据所述方差和及所述协方差,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数的步骤,包括:根据公式:获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数;其中,ρm[k]为当前帧语音信号在频点m处的频谱矢量与前一帧语音信号在频点m处的频谱矢量之间的相干系数;Δn,m[k]为当前帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差;为麦克风阵列捕获的语音信号的第k帧第m个频点的谱线的方差和;为麦克风阵列捕获的语音信号的第k-1帧第m个频点的谱线的方差和;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。19.根据权利要求13所述的语音去混响的方法,其特征在于,所述根据所述相干系数,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方的步骤,包括:根据公式:C2[k,m]=|ρm[k]|2获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方;其中,C2[k,m]为当前帧语音信号在频点m处的频谱矢量与前一帧语音信号在频点m处的频谱矢量间相干系数的幅值平方;ρm[k]为当前帧语音信号在频点m处的频谱矢量与前一帧语音信号在频点m处的频谱矢量之间的相干系数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。20.根据权利要求1所述的语音去混响的方法,其特征在于,所述获取所述第一频点中每一频点处的频谱的去混响后的第一语音信号频谱矢量,包括:根据公式:获取去混响后的第一语音信号频谱矢量;其中,为去混响后的第一语音信号频谱矢量;为麦克风阵列捕获到的语音信号的频谱矢量;为Wm[k-1]的共轭转置矩阵;Wm[k-1]为第k-1帧的语音信号的频谱矢量的预测系数矩阵;为麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。21.根据权利要求1所述的语音去混响的方法,其特征在于,所述根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新,包括:获取卡尔曼增益;根据所述卡尔曼增益以及去混响后的第一语音信号频谱矢量,进行第一频点中每一频点的加权预测误差的预测系数矩阵的更新。22.根据权利要求21所述的语音去混响的方法,其特征在于,所述获取卡尔曼增益的步骤,包括:根据公式:获取;其中,Km[k]为卡尔曼增益;为麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号;为的共轭转置矩阵;为第K-1帧信号的相关矩阵的逆矩阵;Λm2[k]为麦克风阵列捕获的语音信号的功率;α为遗忘因子,且0<α<1;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。23.根据权利要求22所述的语音去混响的方法,其特征在于,所述麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号的获取方式为:根据公式:获取麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号;其中,为麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数;n=1,2,…,N,且N为捕获语音信号的麦克风总数;N′>Δ且N′和Δ均为正整数;yn,m[k-Δ-(N′-1)]为第n个麦克风接收信号的第k-Δ-(N′-1)帧快速傅氏变换中第m个频点的谱线。24.根据权利要求22所述的语音去混响的方法,其特征在于,所述麦克风阵列捕获的语音信号的功率的获取方式为:根据公式:获取麦克风阵列捕获的语音信号的功率;其中,Λm2[k]为麦克风阵列捕获的语音信号的功率;yn,m[k]为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。25.根据权利要求20所述的语音去混响的方法,其特征在于,在所述根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新之后,还包括:根据公式:进行相关矩阵的逆矩阵的更新;其中,为第k帧相关矩阵的逆矩阵;为第k-1帧相关矩阵的逆矩阵;Km[k]为卡尔曼增益;为的共轭转置矩阵;为麦克风阵列捕获的第k帧语音信号前的预设帧数的阵列信号;α为遗忘因子,且0<α<1;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。26.根据权利要求21所述的语音去混响的方法,其特征在于,所述根据所述卡尔曼增益以及去混响后的第一语音信号频谱矢量,进行第一频点中每一频点的加权预测误差的预测系数矩阵的更新的步骤,包括:根据公式:进行第一频点中每一频点的加权预测误差的预测系数矩阵的更新;其中,Wm[k]为更新后的预测系数矩阵;Wm[k-1]为更新前的预测系数矩阵;Km[k]为卡尔曼增益;为的共轭转置矩阵;为去混响后的第一语音信号频谱矢量;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。27.根据权利要求1所述的语音去混响的方法,其特征在于,所述根据所述第一语音信号频谱矢量和非语音信号频谱矢量,获取去混响语音信号的步骤,包括:根据所述第一语音信号频谱矢量和非语音信号频谱矢量,获取每帧语音信号的第二语音信号频谱矢量;根据每帧语音信号的第二语音信号频谱矢量,获取去混响语音信号。28.一种语音去混响的装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现以下步骤:获取麦克风阵列捕获的每帧语音信号的频谱矢量;根据所述每帧语音信号的频谱矢量,分别获取检测结果为语音的信号帧的第一频点以及检测结果为非语音的信号帧的第二频点;获取所述第一频点中每一频点处的频谱的去混响后的第一语音信号频谱矢量,并根据所述第一语音信号频谱矢量对每一频点的加权预测误差的预测系数矩阵进行更新;获取第二频点中每一频点的频谱进行衰减后的非语音信号频谱矢量;根据所述第一语音信号频谱矢量和非语音信号频谱矢量,获取去混响语音信号。29.根据权利要求28所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取麦克风阵列实时捕获的语音信号;对每一帧语音信号进行频谱计算,得到麦克风阵列捕获的每帧语音信号的频谱矢量。30.根据权利要求28所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方;在所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比小于第一门限参数,且所述当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方大于第二门限参数时,将当前帧语音信号在预设频点处标记为语音;或在所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比大于或等于第一门限参数,或所述当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量的幅值平方相干系数小于或等于第二门限参数时,将当前帧语音信号在预设频点处标记为噪音。31.根据权利要求30所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差;根据所述香农熵值和所述香农熵值的方差,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比。32.根据权利要求31所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取检测频点处的每帧语音信号的频谱矢量的幅值权重;根据所述幅值权重,获取每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值;根据所述每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值。33.根据权利要求32所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:获取幅值权重;其中,pn,m[k]为第k帧第m个频点处的语音信号的频谱矢量的幅值权重;yn,m[k]为第n个麦克风接收信号的第k帧快速傅氏变换中第m个频点的谱线;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。34.根据权利要求32所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:获取每一个麦克风捕获的每帧语音信号的频谱矢量的香农熵值;其中,Hn,Y[k]为第k帧第n个麦克风捕获的语音信号的频谱矢量的香农熵值;pn,m[k]为第k帧第m个频点处的语音信号的频谱矢量的幅值权重;n=1,2,…,N,且N为捕获语音信号的麦克风总数;m=1,2,…,M,且M为频点总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。35.根据权利要求32所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;其中,HY[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;Hn,Y[k]为第k帧第n个麦克风捕获的语音信号的频谱矢量的香农熵值;n=1,2,…,N,且N为捕获语音信号的麦克风总数;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。36.根据权利要求31所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值,获取所述香农熵值的均值;根据所述麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值以及所述香农熵值的均值,获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差。37.根据权利要求36所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:μH[k]=λ·μH[k-1]+(1-λ)·HY[k]获取香农熵值的均值;其中,μH[k]为第k帧语音信号的频谱矢量的香农熵值的均值;HY[k]为麦克风阵列捕获的第k帧语音信号的频谱矢量的香农熵值;μH[k-1]为第k-1帧语音信号的频谱矢量的香农熵值的均值;λ为平滑系数,且0<λ<1;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。38.根据权利要求36所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值的方差;其中,为第k帧麦克风阵列信号谱矢量的香农熵值的方差;为第k-1帧麦克风阵列信号谱矢量的香农熵值的方差;μH[k]为第k帧语音信号的频谱矢量的香农熵值的均值;HY[k]为麦克风阵列捕获的第k帧语音信号的频谱矢量的香农熵值;λ为平滑系数,且0<λ<1;k为信号帧索引变量,k=1,2,…,K,且K为语音信号总帧数。39.根据权利要求31所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:根据公式:获取麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;其中,C1[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值和所述香农熵值的方差之比;HY[k]为麦克风阵列捕获的每帧语音信号的频谱矢量的香农熵值;为第k帧麦克风阵列信号谱矢量的香农熵值的方差;k为信号帧索引变量,k=1,2,…,K,且K为总信号帧数。40.根据权利要求30所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数;根据所述相干系数,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量间相干系数的幅值平方。41.根据权利要求40所述的语音去混响的装置,其特征在于,所述计算机程序被处理器执行时还可实现如下步骤:获取麦克风阵列捕获的当前帧语音信号的频谱矢量在预设频点处的谱线的方差和及当前帧语音信号的频谱矢量与前一帧语音信号的频谱矢量之间的协方差;根据所述方差和及所述协方差,获取当前帧语音信号在预设频点的频谱矢量与前一帧语音信号在预设频点的频谱矢量之间的相干系数。42...
【专利技术属性】
技术研发人员:李佳芮,梁民,
申请(专利权)人:电信科学技术研究院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。