The invention discloses a processing method, a device, an electronic device and a storage medium for speech recognition in vehicle environment. The methods include: obtaining the reference audio, recording the reference audio to obtain the recorded audio recordings, obtaining the pure voice, selecting the noise data to meet the target signal to noise ratio from the recordings audio, and superimposing the noise data to the pure voice to get the noisy speech, and the noisy speech and the reference audio. Input data is input to AEC module, in which AEC module performs echo cancellation processing on input data, and obtains training data with AEC residual noise. Thus, in the actual online application, through the training data with the residual noise, the speech in the vehicle environment is trained and recognized, the effect of speech recognition is improved, the recognition performance and stability are improved, and the user experience is improved.
【技术实现步骤摘要】
车内环境中语音识别的处理方法、装置和电子设备
本专利技术涉及语音识别
,尤其涉及一种车内环境中语音识别的处理方法、装置、电子设备和计算机可读存储介质。
技术介绍
在应用场景中,回声消除打断处理,例如,唤醒汽车中播放设备播放音乐时,需对唤醒语音进行识别,而在识别该唤醒语音的过程中,由于车内具有各种噪声,所以需对该唤醒语音进行噪声抑制和回声消除。然而,现有技术中的回声消除往往消除的不够彻底,会存在一些残余噪声,而这种残余噪声会直接影响唤醒语音的识别效果。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种车内环境中语音识别的处理方法。该方法可以提高语音识别效果,并提高识别性能和稳定性,提升用户体验。本专利技术的第二个目的在于提出一种车内环境中语音识别的处理装置。本专利技术的第三个目的在于提出一种电子设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达到上述目的,本专利技术第一方面实施例提出的车内环境中语音识别的处理方法,包括:获取参考音频,并对所述参考音频进行录制以得到录制后的回录音 ...
【技术保护点】
一种车内环境中语音识别的处理方法,其特征在于,包括以下步骤:获取参考音频,并对所述参考音频进行录制以得到录制后的回录音频;获取纯净语音;从所述回录音频中选取满足目标信噪比条件的噪声数据,并将所述噪声数据叠加至所述纯净语音上以得到带噪语音;将所述带噪语音和所述参考音频作为输入数据输入至AEC模块,其中,所述AEC模块对所述输入数据进行回声消除处理,得到带有AEC残余噪声的训练数据。
【技术特征摘要】
1.一种车内环境中语音识别的处理方法,其特征在于,包括以下步骤:获取参考音频,并对所述参考音频进行录制以得到录制后的回录音频;获取纯净语音;从所述回录音频中选取满足目标信噪比条件的噪声数据,并将所述噪声数据叠加至所述纯净语音上以得到带噪语音;将所述带噪语音和所述参考音频作为输入数据输入至AEC模块,其中,所述AEC模块对所述输入数据进行回声消除处理,得到带有AEC残余噪声的训练数据。2.如权利要求1所述的方法,其特征在于,所述从回录音频中选取满足预设信噪比条件的噪声数据,包括:确定所述纯净语音的时长;根据所述时长从所述回录音频中选取相同时长的部分回录音频;根据预先统计的信噪比分布从所述部分回录音频中选取满足所述目标信噪比条件的噪声数据。3.如权利要求2所述的方法,其特征在于,通过以下步骤预先统计所述信噪比分布:获取在多个车载场景下回录样本参考音频时的噪声分贝数;统计样本用户在所述多个车载场景下正常说话的音量范围;根据所述多个车载场景下回录样本参考音频时的噪声分贝数和所述样本用户在所述多个车载场景下正常说话的音量范围,计算所述信噪比分布。4.如权利要求1所述的方法,其特征在于,在将所述噪声数据叠加至所述纯净语音上以得到带噪语音之前,所述方法还包括:对所述纯净语音依次叠加车载的冲激响应和车噪以得到第一语音;其中,所述将噪声数据叠加至所述纯净语音上以得到带噪语音,包括:将所述噪声数据叠加至所述第一语音上以得到所述带噪语音。5.如权利要求1所述的方法,其特征在于,在将所述带噪语音和所述参考音频作为输入数据输入至AEC模块之前,所述方法还包括:从所述回录音频的时间信息中,获取与所述噪声数据的开始时间对应的目标时间;根据所述目标时间,从所述参考音频中选取与所述噪声数据相同时长的部分参考音频;其中,将所述带噪语音和所述参考音频作为输入数据输入至AEC模块,包括:将所述带噪语音和所述部分参考音频作为输入数据输入至所述AEC模块。6.如权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:根据所述带有AEC残余噪声的训练数据,实时更新车内环境中的语音识别训练模型;根据实时更新后的车内环境中的语音识别训练模型进行车内语音识别。7.一种车内环境中语音识别的处理装置,其特征在于,包括:第一获取模块,用于获取参考音频;录制模块,用于对所述参考音频进行录制以得到录制后的回录音频;第二获取模块,用于获取纯净语音;第三获取模块,用于从所述回录音频中选取满足目标信噪比条件的噪声数据;第一叠加模块...
【专利技术属性】
技术研发人员:宋辉,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。