【技术实现步骤摘要】
语音唤醒方法、装置、电子设备及存储介质
本申请涉及语音处理
,具体而言,涉及一种语音唤醒方法、装置、电子设备及存储介质。
技术介绍
目前,电子设备越来越普及,通常,为了节省系统开销,电子设备在闲置一段时间后可以进入待机状态,之后,当该电子设备的电源键被按下时,该电子设备可以被唤醒。但由于硬件唤醒的方式需要用户手动操作,效率较低,因此,随着语音处理技术的不断发展,更加智能和高效的语音唤醒开始逐渐受到关注。现有技术中,用户可以通过说话发出语音,电子设备获取到待识别语音数据并对该待识别语音数据进行识别,如果识别到该待识别语音数据是否预设唤醒词对应,则进入唤醒状态,否则继续保持待机状态。但在现有技术中,电子设备通常只能够识别一个预设唤醒词,用户需要严格针对该预设唤醒词发出语音才能够唤醒该电子设备,如果用户所发出的语音中还包括其它与该预设唤醒词无关的信息,则无法唤醒该电子设备,语音唤醒的灵活性和效率低下。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种语音唤醒方法、装置、电子设 ...
【技术保护点】
1.一种语音唤醒方法,其特征在于,包括:/n获取待识别语音数据;/n对所述待识别语音数据进行识别,获取所述待识别语音数据的识别结果;/n若所述识别结果包括多个预设唤醒词中的至少一个,则从待机状态切换至唤醒状态。/n
【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:
获取待识别语音数据;
对所述待识别语音数据进行识别,获取所述待识别语音数据的识别结果;
若所述识别结果包括多个预设唤醒词中的至少一个,则从待机状态切换至唤醒状态。
2.根据权利要求1所述的方法,其特征在于,所述对所述待识别语音数据进行识别,获取所述待识别语音数据的识别结果,包括:
识别所述待识别语音数据的多个目标关键词元素,各所述目标关键词元素包括至少一个字符;
基于所述多个目标关键词元素在所述待识别语音数据中的出现顺序,将所述多个目标关键词元素拼接,得到目标语句。
3.根据权利要求2所述的方法,其特征在于,所述识别所述待识别语音数据的多个目标关键词元素,包括:
通过预设声学打分模型对所述待识别语音数据进行打分处理,得到评分矩阵,所述评分矩阵的每行对应一个目标关键词元素,每行包括的多个列表示所述目标关键词元素针对多个预设关键词元素的评分;
分别从所述评分矩阵的各行包括的多个评分中,获取最高评分所在列的索引,得到多个索引;
分别获取所述多个索引对应的预设关键词元素,得到所述多个目标关键词元素。
4.根据权利要求3所述的方法,其特征在于,所述通过预设声学打分模型对所述待识别语音数据进行打分处理,得到评分矩阵,包括:
对所述待识别语音数据进行分帧处理,得到多组语音子数据;
通过所述预设声学打分模型对所述多组语音子数据进行打分处理,得到所述评分矩阵。
5.根据权利要求3所述的方法,其特征在于,所述分别从所述评分矩阵的各行包括的多个评分中,获取最高评分所在列的索引,包括:
获取当前行的前一行中最高评分的索引作为前置索引;
从索引构图中,获取与所述前置索引相邻的多个后置索引,所述索引构图包括多个预设关键词元素对应的索引之间的前后置关系;
基于当前行中与所述多个后置索引对应的列的评分,从所述多个后置索引中获取最高评分对应的后置索引。
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个目标关键词元素在所述待识别语音数据中的出现顺序,将所述多个目标关键词元素拼接,包括:
基于所述多个目标关键词元素中相邻两个目标关键词元素在索引构图中的前后置关系,将所述多个目标关键词元素依次拼接,所述索引构图包括多个预设关键词元素对应的索引之间的前后置关系。
7.根据权利要求3所述的方法,其特征在于,在所述通过预设声学打分模型对所述待识别语音数据进行打分之前,还包括:
获取多个样本语音数据,所述样本语音数据包括至少一个目标关键词元素,且所述多个样本语音数据包括至少一个预设唤醒词所包括的所有目标关键词元素;
基于所述多个样本语音数据对所述预设声学打分模型进行训练。
8.根据权利要求5或6所述的方法,其特征在于,还包括:
获取多个预设关键词元素;
分别确定各所述预设关键词元素的索引;
基于各所述预设关键词元素对应的索引,生成所述索引构图。
9.根据权利要求3所述的方法,其特征在于,所述目标关键词元素和所述预设关键词元素包括一个汉字。
10.一种语音唤醒装置,其特征在于,包括:
第一获取模块,用于获取待识别语音数据;
识别模块,用于对所述待识别语音数据进行识...
【专利技术属性】
技术研发人员:刘阳,王飞,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。