【技术实现步骤摘要】
一种应用于车辆的语音指令识别方法及装置
[0001]本专利技术涉及语音识别
,具体而言,涉及一种应用于车辆的语音指令识别方法及装置。
技术介绍
[0002]随着汽车工业的发展以及电子市场的成熟,车载智能终端逐渐成为汽车重要的配套设备。近年来,经济的繁荣也促使国内的汽车数量急剧增加,人们的出行习惯也随之发生变化,人车共处的时间越来越长。因此,车载智能终端的功能也从简单的行车导航向多功能的方向改变。
[0003]在新近发展出的众多功能中,语音指令的识别和执行十分引人注目。然而,现有的车载智能终端由于自身配备的指令集有限,其识别精度不够,容易受到环境噪声的影响,例如,在车窗开启时,轮胎噪声、风噪、环境噪声的存在会导致用户发出的语音指令被淹没在上述噪声中,进而造成语音指令无法识别或者识别错误的情况,严重影响了用户对于语音控制功能的使用。
技术实现思路
[0004]本专利技术的目的在于提供一种应用于车辆的语音指令识别方法及装置,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:
[0 ...
【技术保护点】
【技术特征摘要】
1.一种应用于车辆的语音指令识别方法,其特征在于,包括:获取唤醒指令,所述唤醒指令为第一语音信息中可以唤醒车辆控制中心接收控制指令的语音指令,所述第一语音信息为车辆内语音采集设备所采集的出现所述唤醒指令之前的语音数据;响应于所述唤醒指令获取第二语音信息并做预处理,得到预处理后的语音信息,所述第二语音信息为车辆内语音采集设备所采集的出现所述唤醒指令之后的语音数据;基于所述预处理后的语音信息利用端点检测算法进行处理,得到语音输入信息;基于帧数据的特征提取算法对所述语音输入信息进行处理,得到语音特征;基于所述语音特征利用声学模型匹配算法进行处理,得到控制指令识别结果。2.根据权利要求1所述的应用于车辆的语音指令识别方法,其特征在于,所述响应于所述唤醒指令获取第二语音信息并做预处理中预处理的方法包括:获取所述第二语音信息对应的时域波形并做短时傅里叶变换,得到时频域;基于所述时频域通过计算分别得到理想比值掩蔽和对数功率谱值,并将所述理想比值掩蔽作为卷积循环网络语音增强模型的权重进行训练,得到训练后的卷积循环网络语音增强模型;基于所述对数功率谱值作为所述训练后的卷积循环网络语音增强模型得输入值,得到对数功率幅度谱;基于所述对数功率幅度谱进行计算,得到增强语音;基于所述增强语音利用降噪算法进行处理,得到预处理后的语音信息。3.根据权利要求2所述的应用于车辆的语音指令识别方法,其特征在于,所述理想比值掩蔽的计算公式为:所述对数功率谱值的计算公式为:Y=10
×
lg(|Q
t,f
|2);其中:IRM(w,t)为理想比值掩蔽;Q
t,f
、C
t,f
和Z
t,f
分别为含噪声语音、纯净语音和噪声在时间t和频点f上的幅度谱;和分别为Q
t,f
、C
t,f
和Z
t,f
对应的相位谱;Y为对数功率谱值。4.根据权利要求1所述的应用于车辆的语音指令识别方法,其特征在于,基于帧数据的特征提取算法对所述语音输入信息进行处理,得到语音特征包括:基于所述语音输入信息采用高通滤波器进行高频信号突出处理,得到滤波后的语音信息;基于滤波后的语音信息滑动加窗,进行语音分帧后获取分割后的短时语音信号;基于所述短时语音信号做快速傅里叶变换后,然后利用梅尔倒频谱系数法进行分析处
理,得到对数能量;基于所述对数能量进行离散余弦变换,以提取倒谱系数得到语音特征。5.根据权利要求4所述的应用于车辆的语音指令识别方法,其特征在于,所述对数能量的计算公式为:其中:L为对数能量;X
i
(n)为分帧后的第i帧片段的短时语音信号;e为自然常数;N为傅里叶变换的总帧长;k为频域中傅里叶变换的第k条谱线;M为梅尔滤波器的个数;j为傅里叶变换中的虚数单位;H
m
(k)为第m个梅尔滤波器第k条谱线对应的幅度。6.根据权利要求1所述的应用于车辆的语音指令识别方法,其特征在于,基于所述语音特征利用声学模型匹配算法进行处理,得到控制指令识别结果之后还包括:基于所述控制指令识别结果确定控制指令,并基于所述控制指令是否在身份验证名单中,所述身份验证名单是用于表征需要进行身份验证才能执行的控制指令的集合;若所述控制指令在所述身份验证名单中则进行身份验证;若所述控制指令不在所述身份验证名单中,则获取所述控制指令发出时对应的第一时间戳和第一方位信息;基于时间戳和方位信息进行计算,确定所述控制指令执行的优先级序列,所述时间戳包括所述第一时间戳和第二时间戳,所述方位信息包括所述第一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。