The embodiment of the invention discloses a reverberation elimination method, device, device and storage medium, the method includes: acquiring voice signal; time-frequency decomposition based on the voice signal to obtain auditory spectrum; extracting the first mrcg feature based on the auditory spectrum; inputting the first mrcg feature into the pre trained reverberation elimination model to obtain the second mrcg feature; and based on the second mrcg feature The speech signal after eliminating reverberation is obtained by speech transformation. The method provided by the embodiment of the invention can achieve good de reverberation effect for voice with various reverberation degrees.
【技术实现步骤摘要】
一种混响消除方法、装置、设备及存储介质
本专利技术属于信号处理
,尤其涉及一种语音混响消除方法、装置、设备及存储介质。
技术介绍
声音混响是日常生活中较为普遍的一种现象,适量的早期混响可以使声音饱满,但混响时间过长会产生严重的负面影响,且通常会对语音的清晰度有一定的影响,尤其是对有听力障碍的听众。当说话人与麦克风距离较远时,麦克风采集到的语音通常含有较多的混响成分,过大的混响不仅会影响到语音的清晰度和可懂度,同时也影响到后续语音识别等语音信号处理的性能。因此对具有混响的音频进行混响的消除具有重要的意义。传统的混响消除方法包括基于波束形成的混响消除、基于逆滤波的混响消除以及基于语音增强的混响消除方法,基于波束形成的混响消除又分为固定波束形成和自适应波束形成两种方法,基于固定波束形成的混响消除方法易实现,但不能应用于变化的声学环境,基于自适应波束形成的混响消除方法只能抑制波束方向的混响,计算复杂度高;基于逆滤波的混响消除难以应用于实际。峰值检测法不能用于复杂的混响模型中。
技术实现思路
本专利技术实施例提供一种混响消除方法、装置、设备及存储介质,环境适应度强能够适应各种复杂的混响模型实现混响消除。第一方面,本专利技术实施例提供了一种混响消除方法,包括:获取语音信号;基于所述语音信号进行时频分解得到听觉谱;基于所述听觉谱提取第一MRCG特征;将所述第一MRCG特征输入预先训练好的混响消除模型得到第二MRCG特征;基于所述第二MRCG特征通过语 ...
【技术保护点】
1.一种混响消除方法,其特征在于,包括:/n获取语音信号;/n基于所述语音信号进行时频分解得到听觉谱;/n基于所述听觉谱提取第一MRCG特征;/n将所述第一MRCG特征输入预先训练好的混响消除模型得到第二MRCG特征;/n基于所述第二MRCG特征通过语音变换得到消除混响后的语音信号。/n
【技术特征摘要】
1.一种混响消除方法,其特征在于,包括:
获取语音信号;
基于所述语音信号进行时频分解得到听觉谱;
基于所述听觉谱提取第一MRCG特征;
将所述第一MRCG特征输入预先训练好的混响消除模型得到第二MRCG特征;
基于所述第二MRCG特征通过语音变换得到消除混响后的语音信号。
2.根据权利要求1所述的混响消除方法,其特征在于,所述基于所述语音信号进行时频分解得到听觉谱,包括:
选择听觉滤波器对所述语音信号进行滤波,得到滤波输出;
采用交叠分段的方法,以第一预设时间为帧长,第二预设时间为偏移量对每一个频率通道的所述滤波输出做分帧加窗,得到输入信号的时频域表示,即时频单元;
根据所述时频单元计算听觉滤波器输出能量,得到听觉谱。
3.根据权利要求2所述的混响消除方法,其特征在于,所述听觉滤波器为Gammatone听觉滤波器,其时域脉冲响应为:
其中,l为滤波器的阶数,b为滤波器的衰减因子,f为滤波器的中心频率。
4.根据权利要求2所述的混响消除方法,其特征在于,所述基于所述听觉谱提取第一MRCG特征包括:
对输入的语音信号,计算64通道的听觉谱CG1,对每一个时频单元取对数操作;
以第三预设时间为帧长,以第二预设时间为帧移计算得到听觉谱CG2;
用一个长为11时间帧和宽为11频带的方形窗对所述听觉谱CG1进行平滑,得到听觉谱CG3;
使用23×23的方形窗对所述听觉谱CG1进行平滑,得到听觉谱CG4;
串联听觉谱CG1、CG2、CG3和CG4得到一个64×4的向量,即为第一MRCG特征。
5.根据权利要求1-4所述的混响消除方法,其特征在于,所述预先训练好的混响消除模型为一个深度置信网络模型,包括2个RBM网络和1个BP网络。
6.根据权利要求5所述的混响消除方法,其特征在于,所述预先训练好的混响消除模型的训练过程包括:
A、获取包括多个混响语音信号和纯净语音信号的音频数据;
B、基于所述多个混响语音信号和纯净语音信号进行时频分解得到多个混响听...
【专利技术属性】
技术研发人员:雒航通,
申请(专利权)人:深圳乐信软件技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。