语音唤醒方法、装置、系统、设备、服务器及存储介质制造方法及图纸

技术编号:20428557 阅读:20 留言:0更新日期:2019-02-23 09:42
本申请提供了一种语音唤醒方法、装置、系统、设备、服务器及可读存储介质,语音唤醒方法包括:智能设备接收音频数据,并在设置的缓存区中缓存当前时刻之前预设时长的音频数据,对接收的音频数据进行初步唤醒判断,当判断出接收的音频数据存在指定唤醒词时,将缓存的音频数据和当前以及后续接收的音频数据发送至云端服务器,云端服务器接收智能设备发送的音频数据,基于音频数据中的指定唤醒词和指定唤醒词的上下文信息,确定用户是否在唤醒智能设备;若确定出用户不是在唤醒智能设备,则向智能设备发送禁止唤醒指令。本申请结合指定唤醒词的上下文信息进行唤醒判断,能够减少错误唤醒情况的发生,显著提高语音唤醒的准确率。

【技术实现步骤摘要】
语音唤醒方法、装置、系统、设备、服务器及存储介质
本申请涉及人工智能
,尤其涉及一种语音唤醒方法、装置、系统、设备、服务器及存储介质。
技术介绍
语音唤醒技术是语音识别技术中的重要分支,其通过监听用户语音来判断用户是否说出了指定唤醒词,当判断出用户说出了指定唤醒词时,唤醒电子设备。目前,语音唤醒技术已广泛应用于各种智能设备上,如智能穿戴设备、手机、平板电脑、智能家电等。虽然语音唤醒技术已得到广泛应用,但其仍存在误唤醒的问题,即唤醒准确率不高,唤醒效果不好。
技术实现思路
有鉴于此,本申请提供了一种语音唤醒方法、装置、系统、设备、服务器及可读存储介质,用以提高唤醒准确率,其技术方案如下:一种语音唤醒方法,应用于云端服务器,所述方法包括:接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;若确定出用户不是在唤醒所述智能设备,则向所述智能设备发送禁止唤醒指令。优选地,所述语音唤醒方法还包括:在基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备时,并行执行对所述音频数据中所述指定唤醒词之后的音频数据进行响应操作,获得响应操作结果。优选地,所述基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备,包括:从所述音频数据中获取包含所述指定唤醒词和所述指定唤醒词上下文信息的音频数据作为第一目标音频数据;通过所述第一目标音频数据中所述指定唤醒词的上下文信息,确定所述指定唤醒词是否符合预设唤醒规则;若所述指定唤醒词符合所述预设唤醒规则,则确定用户是在唤醒所述智能设备;若所述指定唤醒词不符合所述预设唤醒规则,则确定用户不是在唤醒所述智能设备。优选地,所述语音唤醒方法还包括:从所述音频数据中获取所述指定唤醒词之后的音频数据作为第二目标音频数据;对所述第二目标音频数据进行响应操作,获得响应操作结果,所述响应操作包括语音识别、语义理解和对话管理。优选地,所述语音唤醒方法还包括:当确定出用户是在唤醒所述智能设备时,将所述响应操作结果发送至所述智能设备。优选地,所述从所述音频数据中获取包含所述指定唤醒词和所述指定唤醒词上下文信息的音频数据作为第一目标音频数据,包括:从所述音频数据中获取目标时间之前的第一时间到所述目标时间之后的第二时间之间的音频数据作为第一目标音频数据;其中,所述目标时间为所述指定唤醒词对应的音频数据中最后一帧的结束时间,所述目标时间与所述第一时间相隔第一预设时长,所述第二时间与所述目标时间相隔第二预设时长。一种语音唤醒方法,应用于智能设备,所述方法包括:接收音频数据,并在所述智能设备设置的音频缓存区中缓存音频数据,所述音频缓存区中缓存的音频数据为当前时刻之前预设时长的音频数据;确定当前接收的音频数据中是否包含指定唤醒词;若所述当前接收的音频数据中包含所述指定唤醒词,则将所述音频缓存区中缓存的音频数据和当前以及后续接收的音频数据发送至云端服务器,以使所述云端服务器进一步基于接收的音频数据判断用户是否在唤醒所述智能设备。所述语音唤醒方法还包括:当接收到所述云端服务器发送的禁止唤醒指令时,不执行唤醒操作;当接收到所述云端服务器针对其接收的音频数据的响应操作结果时,执行唤醒操作并基于所述响应操作结果响应用户。一种语音唤醒装置,应用于云端服务器,所述装置包括:音频接收模块、唤醒判别模块和指令发送模块;所述音频接收模块,用于接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;所述唤醒判别模块,用于基于所述音频接收模块接收的所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;所述指令发送模块,用于在所述唤醒判别模块确定出用户不是在唤醒所述智能设备时,向所述智能设备发送禁止唤醒指令。一种语音唤醒装置,应用于智能设备,所述装置包括:音频接收模块、音频缓存模块、初步唤醒判别模块和音频发送模块;所述音频接收模块,用于接收音频数据;所述音频缓存模块,用于在所述智能设备设置的音频缓存区中缓存音频数据,所述音频缓存区中缓存的音频数据为当前时刻之前预设时长的音频数据;所述初步唤醒判别模块,用于确定当前接收的音频数据中是否包含指定唤醒词;所述音频发送模块,用于当所述确定模块确定出所述当前接收的音频数据中包含所述指定唤醒词时,将所述音频缓存区中缓存的音频数据和当前以及后续接收的音频数据发送至云端服务器,以使所述云端服务器进一步基于接收的音频数据判断用户是否在唤醒所述智能设备。一种语音唤醒系统,包括:智能设备和云端服务器;所述智能设备,用于接收音频数据,并在设置的音频缓存区中缓存音频数据,所述音频缓存区中缓存的音频数据为当前时刻之前预设时长的音频数据;以及,确定当前接收的音频数据中是否包含指定唤醒词;若所述当前接收的音频数据中包含所述指定唤醒词,则将所述音频缓存区中缓存的音频数据和当前以及后续接收的音频数据发送至所述云端服务器;所述云端服务器,用于接收所述智能设备发送的音频数据,所述音频数据至少包含所述指定唤醒词和所述指定唤醒词的上下文信息;以及基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备,若确定出用户不是在唤醒所述智能设备,则向所述智能设备发送禁止唤醒指令。优选地,所述云端服务器,在基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备时,并行的对所述音频数据中所述指定唤醒词之后的音频数据进行响应操作,获得响应操作结果。优选地,所述云端服务器,具体用于从所述音频数据中获取包含所述指定唤醒词和所述指定唤醒词上下文信息的音频数据作为第一目标音频数据,通过所述第一目标音频数据中所述指定唤醒词的上下文信息,确定所述指定唤醒词是否符合预设唤醒规则,若所述指定唤醒词符合所述预设唤醒规则,则确定用户是在唤醒所述智能设备,若所述指定唤醒词不符合所述预设唤醒规则,则确定用户不是在唤醒所述智能设备。优选地,所述云端服务器,还用于从所述音频数据中获取所述指定唤醒词之后的音频数据作为第二目标音频数据;对所述第二目标音频数据进行响应操作,获得响应操作结果,所述响应操作包括语音识别、语义理解和对话管理。优选地,所述云端服务器,还用于当确定出用户是在唤醒所述智能设备时,将所述响应操作结果发送至所述智能设备。一种云端服务器,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,所述程序具体用于:接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;若确定出用户不是在唤醒所述智能设备,则向所述智能设备发送禁止唤醒指令。一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述语音唤醒方法的各个步骤。一种智能设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,所述程序具体用于:接收音频数据本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,其特征在于,应用于云端服务器,所述方法包括:接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;若确定出用户不是在唤醒所述智能设备,则向所述智能设备发送禁止唤醒指令。

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,应用于云端服务器,所述方法包括:接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;若确定出用户不是在唤醒所述智能设备,则向所述智能设备发送禁止唤醒指令。2.根据权利要求1所述的语音唤醒方法,其特征在于,还包括:在基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备时,并行执行对所述音频数据中所述指定唤醒词之后的音频数据进行响应操作,获得响应操作结果。3.根据权利要求1或2所述的语音唤醒方法,其特征在于,所述基于所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备,包括:从所述音频数据中获取包含所述指定唤醒词和所述指定唤醒词上下文信息的音频数据作为第一目标音频数据;通过所述第一目标音频数据中所述指定唤醒词的上下文信息,确定所述指定唤醒词是否符合预设唤醒规则;若所述指定唤醒词符合所述预设唤醒规则,则确定用户是在唤醒所述智能设备;若所述指定唤醒词不符合所述预设唤醒规则,则确定用户不是在唤醒所述智能设备。4.根据权利要求1所述的语音唤醒方法,其特征在于,所述方法还包括:从所述音频数据中获取所述指定唤醒词之后的音频数据作为第二目标音频数据;对所述第二目标音频数据进行响应操作,获得响应操作结果。5.根据权利要求2或4所述的语音唤醒方法,其特征在于,所述方法还包括:当确定出用户是在唤醒所述智能设备时,将所述响应操作结果发送至所述智能设备。6.根据权利要求3所述的语音唤醒方法,其特征在于,所述从所述音频数据中获取包含所述指定唤醒词和所述指定唤醒词上下文信息的音频数据作为第一目标音频数据,包括:从所述音频数据中获取目标时间之前的第一时间到所述目标时间之后的第二时间之间的音频数据作为第一目标音频数据;其中,所述目标时间为所述指定唤醒词对应的音频数据中最后一帧的结束时间,所述目标时间与所述第一时间相隔第一预设时长,所述第二时间与所述目标时间相隔第二预设时长。7.一种语音唤醒方法,其特征在于,应用于智能设备,所述方法包括:接收音频数据,并在所述智能设备设置的音频缓存区中缓存音频数据,所述音频缓存区中缓存的音频数据为当前时刻之前预设时长的音频数据;确定当前接收的音频数据中是否包含指定唤醒词;若所述当前接收的音频数据中包含所述指定唤醒词,则将所述音频缓存区中缓存的音频数据和当前以及后续接收的音频数据发送至云端服务器,以使所述云端服务器进一步基于接收的音频数据判断用户是否在唤醒所述智能设备。8.根据权利要求7所述的语音唤醒方法,其特征在于,还包括:当接收到所述云端服务器发送的禁止唤醒指令时,不执行唤醒操作;当接收到所述云端服务器针对其接收的音频数据的响应操作结果时,执行唤醒操作并基于所述响应操作结果响应用户。9.一种语音唤醒装置,其特征在于,应用于云端服务器,所述装置包括:音频接收模块、唤醒判别模块和指令发送模块;所述音频接收模块,用于接收智能设备发送的音频数据,所述音频数据至少包含指定唤醒词和所述指定唤醒词的上下文信息;所述唤醒判别模块,用于基于所述音频接收模块接收的所述音频数据中的所述指定唤醒词和所述指定唤醒词的上下文信息,确定用户是否在唤醒所述智能设备;所述指令发送模块,用于在所述唤醒判别模块确定出用户不是在唤醒所述智能设备时,向所述智能设备发送禁止唤醒指令。10.一种语音唤醒装置,其特征在于,应用于智能设备,所述装置包括:音频接收模块、音频缓存模块、初步唤醒判别模块和音频发送模块;所述音频接收模块,用于接收音频数据;所述音频缓存模块,用于在所述智能设备设置的音频缓存区中缓存音频数据,所述音频缓存区中缓存的音频数据为...

【专利技术属性】
技术研发人员:陈志刚梅林海林满佳
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1