The present invention is to wake up method and device, a voice recognition function wherein the method comprises: obtaining the wake-up function of speech recognition target wake word and at least one redundant word command; on the target words and awaken the at least one redundant command words were trained by the depth of the neural network, to awaken word recognition model get the current user input; voice information; according to the wake-up word recognition model determines the current voice information belonging to the target to awaken confidence words; according to the confidence level to determine whether to allow the wake-up speech recognition function. Through this technical scheme, the accuracy of the recognition of the wake-up words can be guaranteed, thus improving the accuracy of the awakening of the speech recognition function and reducing the false awakening.
【技术实现步骤摘要】
语音识别功能的唤醒方法及装置
本专利技术涉及语音识别
,尤其涉及一种语音识别功能的唤醒方法及装置。
技术介绍
目前,相关技术中可以通过语音对设备进行控制,设备不是实时录音并识别语音命令的,而是先识别是否收到唤醒词,如果收到唤醒词则激活,然后识别语音命令。而如果误识别了唤醒词,则会导致误唤醒。
技术实现思路
本专利技术实施例提供一种语音识别功能的唤醒方法及装置,用以实现提高语音识别功能唤醒的准确率,降低误唤醒。根据本专利技术实施例的第一方面,提供一种语音识别功能的唤醒方法,包括:获取唤醒语音识别功能的目标唤醒词和至少一个冗余命令词;利用深度神经网络对所述目标唤醒词和所述至少一个冗余命令词进行训练,得到唤醒词识别模型;获取用户输入的当前语音信息;根据所述唤醒词识别模型确定所述当前语音信息属于所述目标唤醒词的置信度;根据所述置信度确定是否允许唤醒所述语音识别功能。在该实施例中,利用目标唤醒词和冗余命令词进行训练,得到唤醒词识别模型,进而通过该唤醒词识别模型确定当前语音信息属于目标唤醒词的置信度,这样,可以保证唤醒词识别的准确率,从而提高语音识别功能唤醒的准确率,降低误唤醒。在一个实施例中,所述根据所述置信度确定是否允许唤醒所述语音识别功能,包括:当所述置信度大于预设置信度时,允许唤醒所述语音识别功能;当所述置信度小于或者等于所述预设置信度时,禁止唤醒所述语音识别功能。在该实施例中,在当前语音信息属于目标唤醒词的置信度大于预设置信度时,才允许唤醒语音唤醒功能,从而降低语音唤醒功能误唤醒。在一个实施例中,所述利用深度神经网络对所述目标唤醒词和所述至少一个冗余命令词 ...
【技术保护点】
一种语音识别功能的唤醒方法,其特征在于,包括:获取唤醒语音识别功能的目标唤醒词和至少一个冗余命令词;利用深度神经网络对所述目标唤醒词和所述至少一个冗余命令词进行训练,得到唤醒词识别模型;获取用户输入的当前语音信息;根据所述唤醒词识别模型确定所述当前语音信息属于所述目标唤醒词的置信度;根据所述置信度确定是否允许唤醒所述语音识别功能。
【技术特征摘要】
1.一种语音识别功能的唤醒方法,其特征在于,包括:获取唤醒语音识别功能的目标唤醒词和至少一个冗余命令词;利用深度神经网络对所述目标唤醒词和所述至少一个冗余命令词进行训练,得到唤醒词识别模型;获取用户输入的当前语音信息;根据所述唤醒词识别模型确定所述当前语音信息属于所述目标唤醒词的置信度;根据所述置信度确定是否允许唤醒所述语音识别功能。2.根据权利要求1所述的方法,其特征在于,所述根据所述置信度确定是否允许唤醒所述语音识别功能,包括:当所述置信度大于预设置信度时,允许唤醒所述语音识别功能;当所述置信度小于或者等于所述预设置信度时,禁止唤醒所述语音识别功能。3.根据权利要求1所述的方法,其特征在于,所述利用深度神经网络对所述目标唤醒词和所述至少一个冗余命令词进行训练,得到唤醒词识别模型,包括:将所述目标唤醒词确定为正例词,将所述至少一个冗余命令词确定为负例词;利用深度神经网络对所述正例词和所述负例词进行训练,得到所述唤醒词识别模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述唤醒词识别模型确定所述当前语音信息属于所述目标唤醒词的置信度,包括:获取所述当前语音信息对应的当前音频帧特征序列信息;将所述当前音频帧序列信息与目标唤醒词对应的目标识别模型序列信息进行强制对齐处理,以从所述当前音频帧序列信息中定位出与所述目标识别模型序列信息中的每个音素对应的音频帧的范围;计算每个音频帧的范围中每个音频帧的声学似然评分,并从所述每个音频帧的范围中选取出符合预设要求的预设数量的目标音频帧;根据所述唤醒词识别模型和目标音频帧对应的特征信息,确定所述当前语音信息属于所述目标唤醒词的置信度。5.根据权利要求4所述的方法,其特征在于,所述根据所述唤醒词识别模型和目标音频帧对应的特征信息,确定所述当前语音信息属于所述目标唤醒词的置信度,包括:使用所述唤醒词识别模型计算与每个音素对应的多个目标音频帧中每个目标音频帧的声学后验得分;从与每个音素对应的多个声学后验得分中选取出最大声学后验得分;根据所有音素的最大声学后验得分计算所述当前语音信息属于所述目标唤醒...
【专利技术属性】
技术研发人员:谢书杰,苏牧,
申请(专利权)人:北京云知声信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。