【技术实现步骤摘要】
本专利技术涉及语音信号处理,特别涉及一种基于车联网的车载终端语音信号处理方法。
技术介绍
语音识别是通过利用识别算法让机器能够准确地识别出人类所发出的语音命令并执行相应的操作。目前,随着语音信号处理技术的发展,一些较成熟的语音识别系统相继诞生。然而在车载现场环境下使用时,其识别性能会急剧下降。假设一个孤立词识别系统是由纯净语音训练得到的,那么它在相对安静环境下进行语音识别,其识别率可达到100%,但是如果在以90Km/h行驶的汽车内,其识别率下降到了30%。从上述对比数据中可以发现,在行驶中的车辆等噪声环境下语音识别系统性能无法满足人们的需求。在真实环境中,语音信号不可避免地受到各种外部噪声的干扰,而这些噪声的存在会使得带噪语音与原先由纯净语音训练出的模型之间失配,从而影响车载语音识别系统性能。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种基于车联网的车载终端语音信号处理方法,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。优选地,所述将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离,进一步包括:首先对采样信号进行FFT变换,可得:X(f)=A(f)S(f)其中,X(f)和S(f)分别表示采样信号和源信号经FFT变换后得到的频域信号,A(f)是各混合滤波器频率响应构成的矩阵,经过FFT之后,语音信号从时域下的卷积混合变成频域下的瞬时混合;对每个频点fk(k=0,1,…,L-1)通过瞬 ...
【技术保护点】
一种基于车联网的车载终端语音信号处理方法,其特征在于,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。
【技术特征摘要】
1.一种基于车联网的车载终端语音信号处理方法,其特征在于,包括:将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离;通过幅值补偿消除各频点增益差异所导致的幅值模糊,通过短时FFT逆变换将频域信号变换成时域信号,得到时域下对应的语音信号。2.根据权利要求1所述的方法,其特征在于,所述将语音信号的时域混合变换成频域混合,对其中每个频点进行频域分离,进一步包括:首先对采样信号进行FFT变换,可得:X(f)=A(f)S(f)其中,X(f)和S(f)分别表示采样信号和源信号经FFT变换后得到的频域信号,A(f)是各混合滤波器频率响应构成的矩阵,经过FFT之后,语音信号从时域下的卷积混合变成频域下的瞬时混合;对每个频点fk(k=0,1,…,L-1)通过瞬时独立成分分析进行频域分离,如下所示:X(fk)=A(fk)S(fk),k=0,1,…,L-1其中L表示FFT变换后频域下的频点个数,k为频点序号经过FFT变换后,采样信号从时域变到频域,同时也使得待处理数据的数值从实数域变到了复数域,然后利用多变量数据的四维累加量矩阵,并对其做特征分解,从而实现对信号的分离,即:对一组采样信号x=[x1,x2…xN]进行白化处理,N为声源数量,找到一个使得的自相关矩阵为单位矩阵I的线性变换矩阵B,其中,z=...
【专利技术属性】
技术研发人员:谢欣霖,陈波,
申请(专利权)人:成都之达科技有限公司,成都同创合一科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。