【技术实现步骤摘要】
一种噪声环境下的基于深度神经网络的语音唤醒方法
[0001]本专利技术涉及语音唤醒
,具体为一种噪声环境下的基于深度神经网络的语音唤醒方法。
技术介绍
[0002]语音唤醒技术是智能语音设备的关键技术,指的是用户通过说出指定的唤醒词,使得智能设备从休眠状态进入激活状态,以接受进一步的命令。
[0003]但在存在噪声尤其是较强噪声的环境下,语音设备的体验感下降严重,唤醒词既容易被诸如音乐声、电视声和背景语音错误地激活,同时噪声环境下正确唤醒的成功率也会受到很大影响,为了改善这种情况,送入唤醒的音频通常会预先通过语音增强的前端模块进行处理,以得到去除噪声后的音频,但是,这种语音经过语音增强前端后得到音频,再进行唤醒检测的方法有着这样的缺陷:
[0004]1.语音增强算法一般都是时域变换到频域后再进行降噪处理,然后再反变换回时域,这中间损失了部分中间信息,导致增强后的语音有畸变;
[0005]2.传统的单通道的语音增强前端对于音乐声、电视声等背景噪声的抑制效果有限;
[0006]3.语音增强前 ...
【技术保护点】
【技术特征摘要】
1.一种噪声环境下的基于深度神经网络的语音唤醒方法,包括包含训练抗噪唤醒模型和唤醒识别,其特征在于:所述训练唤醒模型部分使用干净语音和对应的带噪语音作为训练样本,对所构建的语音唤醒模型进行迭代训练,获得带有抗噪功能的唤醒模型;所述唤醒识别将待识别数据进行与训练时相同的特征提取后,输入到语音唤醒模型,然后分析模型输出分数以得到最终的唤醒结果。2.根据权利要求1所述的一种噪声环境下的基于深度神经网络的语音唤醒方法,其特征在于:所述训练唤醒模型部分包括准备训练数据、特征提取和模型训练,所述唤醒识别包括特征提取、输入模型和解码。3.根据权利要求2所述的一种噪声环境下的基于深度神经网络的语音唤醒方法,其特征在于:所述准备训练数据将用于训练的干净唤醒词数据和不同类型的噪声,以不同信噪比进行加噪,得到带噪的语音数据。4.根据权利要求2所述的一种噪声环境下的基于深度神经网络的语音唤醒方法,其特征在于:所述特征提取将干净语音和带噪语音进行加窗,分帧,傅里叶变换,并基于梅尔域进行特征提取,得到在不同频域上的能量谱密度。5.根据权利要求2所述的一种噪声环境下的基于深度神经网络的语音唤醒方...
【专利技术属性】
技术研发人员:赵亚丽,明杨,缪炜,
申请(专利权)人:上海互问信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。