基于车联网的车载终端语音信号处理方法技术

技术编号:13883903 阅读:84 留言:0更新日期:2016-10-23 18:11
本发明专利技术提供了一种基于车联网的车载终端语音信号处理方法,该方法包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。本发明专利技术提出了一种基于车联网的车载终端语音信号处理方法,减弱了背景噪声对车载语音识别系统的干扰,有效地改善了在噪声环境下车载语音识别系统的性能。

【技术实现步骤摘要】

本专利技术涉及语音信号处理,特别涉及一种基于车联网的车载终端语音信号处理方法
技术介绍
语音识别是通过利用识别算法让机器能够准确地识别出人类所发出的语音命令并执行相应的操作。目前,随着语音信号处理技术的发展,一些较成熟的语音识别系统相继诞生。然而在车载现场环境下使用时,其识别性能会急剧下降。假设一个孤立词识别系统是由纯净语音训练得到的,那么它在相对安静环境下进行语音识别,其识别率可达到100%,但是如果在以90Km/h行驶的汽车内,其识别率下降到了30%。从上述对比数据中可以发现,在行驶中的车辆等噪声环境下语音识别系统性能无法满足人们的需求。在真实环境中,语音信号不可避免地受到各种外部噪声的干扰,而这些噪声的存在会使得带噪语音与原先由纯净语音训练出的模型之间失配,从而影响车载语音识别系统性能。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种基于车联网的车载终端语音信号处理方法,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。优选地,所述将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离,进一步包括:首先对采样信号进行FFT变换,可得:X(f)=A(f)S(f)其中,X(f)和S(f)分别表示采样信号和源信号经FFT变换后得到的频域信号,A(f)是各混合滤波器频率响应构成的矩阵,经过FFT之后,语音信号从时域下的卷积混合变成频域下的瞬时混合;对每个频点fk(k=0,1,…,L-1)通过瞬时独立成分分析进行频域分离,如下所示:X(fk)=A(fk)S(fk),k=0,1,…,L-1其中L表示FFT变换后频域下的频点个数,k为频点序号经过FFT变换后,采样信号从时域变到频域,同时也使得待处理数据的数值从实数域变到了复数域,然后利用多变量数据的四维累加量矩阵,并对其做特征分解,从而实现对信号的分离,即:对一组采样信号x=[x1,x2…xN]进行白化处理,N为声源数量,找到一个使得的自相关矩阵为单位矩阵I的线性变换矩阵B,其中,z=Bx=BAs=Vs令M是N×N维的矩阵,则z的四阶累加矩阵为QZ(M),其第ij个元素定义如下: [ Q z ( M ) ] i j = Σ k = 2 N Σ l = 1 N C u ( z i , z j , z k , z l ) m k l ; i , j = 1 , 2 , ... N ]]>式中,Cu为四阶累加量矩阵中第(k,l)个位置的累加量子矩阵的第i行第j列的元素,mkl为矩阵M中(k,l)个元素,令V=[V1,V2…VN],取矩阵M=[M1,M2…MP],对每个Mi求取QZ(Mi),计算使得QZ(Mi)非对角元素平方和即VH QZ(Mi)V出现极小值的矩阵V,最后提取独立成分u=W’x=VHBx优选地,所述通过幅值补偿消除各频点增益差异所导致的幅值模糊,进一步包括:将频点fk对应的频域采样信号进行独立成分提取过程中计算得到的分离矩阵记为W(fk),所提取的各通道独立成分构成向量:Y(fk,τ),其中τ表示滑动窗的位置,则将该频点上的混合矩阵A(fk)计算为A(fk)=W-1(fk)利用混合矩阵A(fk)对对应频点独立成分进行补偿,计算如下: V 1 j ( f k , τ ) . . . V N j ( f k , τ ) = A 1 j ( 本文档来自技高网...

【技术保护点】
一种基于车联网的车载终端语音信号处理方法,其特征在于,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。

【技术特征摘要】
1.一种基于车联网的车载终端语音信号处理方法,其特征在于,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。2.根据权利要求1所述的方法,其特征在于,所述将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离,进一步包括:首先对采样信号进行FFT变换,可得:X(f)=A(f)S(f)其中,X(f)和S(f)分别表示采样信号和源信号经FFT变换后得到的频域信号,A(f)是各混合滤波器频率响应构成的矩阵,经过FFT之后,语音信号从时域下的卷积混合变成频域下的瞬时混合;对每个频点fk(k=0,1,…,L-1)通过瞬时独立成分分析进行频域分离,如下所示:X(fk)=A(fk)S(fk),k=0,1,…,L-1其中L表示FFT变换后频域下的频点个数,k为频点序号经过FFT变换后,采样信号从时域变到频域,同时也使得待处理数据的数值从实数域变到了复数域,然后利用多变量数据的四维累加量矩阵,并对其做特征分解,从而实现对信号的分离,即:对一组采样信号x=[x1,x2…xN]进行白化处理,N为声源数量,找到一个使得的自相关矩阵为单位矩阵I的线性变换矩阵B,其中,z=...

【专利技术属性】
技术研发人员:谢欣霖陈波
申请(专利权)人:成都之达科技有限公司成都同创合一科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1