语音唤醒方法和装置制造方法及图纸

技术编号:18555533 阅读:39 留言:0更新日期:2018-07-28 12:06
本申请实施例公开了语音唤醒方法和装置。该方法的一具体实施方式包括:接收用户的语音信息;基于所述语音信息得到对应于所述语音信息的唤醒置信度;根据所述唤醒置信度确定所述语音信息是否为疑似唤醒语音信息;响应于确定所述语音信息为疑似唤醒语音信息,对所述语音信息进行二次判断得到二次判断结果,根据所述二次判断结果确定是否执行唤醒操作。该实施方式实现了语音信息的二次验证,降低了智能设备被误唤醒的概率。

【技术实现步骤摘要】
语音唤醒方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及语音唤醒方法和装置。
技术介绍
随着人工智能技术的发展和语音技术的逐渐成熟,以对话式为主的类人式对话交互正在成为一种新型的交互革新,并逐步实现产品化,例如,智能机器人、智能音箱、智能电视、智能冰箱等等,这些智能设备可以将人们的双手从触摸式交互中解放出来。在一些场景下,用户可以使用唤醒语音对智能设备进行唤醒,之后智能设备能够对用户的语音指令进行响应。
技术实现思路
本申请实施例提出了语音唤醒方法和装置。第一方面,本申请实施例提供了一种语音唤醒方法,包括:接收用户的语音信息;基于上述语音信息得到对应于上述语音信息的唤醒置信度;根据上述唤醒置信度确定上述语音信息是否为疑似唤醒语音信息;响应于确定上述语音信息为疑似唤醒语音信息,对上述语音信息进行二次判断得到二次判断结果,根据上述二次判断结果确定是否执行唤醒操作。在一些实施例中,基于上述语音信息得到对应于上述语音信息的唤醒置信度,包括:将上述语音信息输入预先建立的识别模型,得到针对上述语音信息的唤醒置信度,其中,上述识别模型用于表征语音信息与唤醒置信度的对应关系。在一些实施例中,上述识别模型为神经网络模型,上述神经网络模型是通过以下方式训练得到的:获取样本集合,其中,样本包括样本语音信息和样本语音信息是否为唤醒语音信息的标注信息;执行以下训练步骤:将上述样本集合中的至少一个样本语音信息分别输入至初始神经网络模型,得到上述至少一个样本语音信息中的每个样本语音信息对应的预测信息,其中,预测信息表征样本语音信息为唤醒语音信息的概率;将上述至少一个样本语音信息中的每个样本语音信息对应的预测信息与标注信息进行比较;根据比较结果确定上述初始神经网络模型是否达到预设的优化目标;响应于确定上述初始神经网络模型达到预设的优化目标,将上述初始神经网络模型作为训练完成的神经网络模型。在一些实施例中,训练上述神经网络模型的步骤还包括:响应于确定上述初始神经网络模型未达到预设的优化目标,调整上述初始神经网络模型的网络参数,以及继续执行上述训练步骤。在一些实施例中,上述标注信息包括第一标识和第二标识,其中,第一标识表征是唤醒语音信息,第二标识表征不是唤醒语音信息。在一些实施例中,上述二次判断结果包括确认唤醒和确认不唤醒;以及上述对上述语音信息进行二次判断得到二次判断结果,根据上述二次判断结果确定是否执行唤醒操作,包括:将上述语音信息发送到服务端,由上述服务端根据上述语音信息生成二次判断结果;接收上述二次判断结果;响应于确定上述二次判断结果为确认唤醒,执行唤醒操作。第二方面,本申请实施例又提供了一种语音唤醒方法,包括:接收终端发送的疑似唤醒语音信息;将上述疑似唤醒语音信息进行语音识别,得到语音识别结果;将上述语音识别结果与上述终端的目标唤醒词进行匹配;根据匹配结果向上述终端发送二次判断结果,由上述终端根据上述二次判断结果确定是否执行唤醒操作,其中,上述二次判断结果包括确认唤醒或确认不唤醒。在一些实施例中,上述根据匹配结果向上述终端发送二次判断结果,包括:响应于确定上述语音识别结果与上述目标唤醒词匹配成功,向上述终端发送确认唤醒;响应于确定上述语音识别结果与上述目标唤醒词匹配不成功,向上述终端发送确认不唤醒。第三方面,本申请实施例提供了一种语音唤醒装置,包括:接收单元,用于接收用户的语音信息;生成单元,用于基于上述语音信息得到对应于上述语音信息的唤醒置信度;第一确定单元,用于根据上述唤醒置信度确定上述语音信息是否为疑似唤醒语音信息;第二确定单元,用于响应于确定上述语音信息为疑似唤醒语音信息,对上述语音信息进行二次判断得到二次判断结果,根据上述二次判断结果确定是否执行唤醒操作。在一些实施例中,上述生成单元进一步用于:将上述语音信息输入预先建立的识别模型,得到针对上述语音信息的唤醒置信度,其中,上述识别模型用于表征语音信息与唤醒置信度的对应关系。在一些实施例中,上述识别模型为神经网络模型;以及上述装置还包括模型训练单元,上述模型训练单元包括:获取单元,用于获取样本集合,其中,样本包括样本语音信息和样本语音信息是否为唤醒语音信息的标注信息;执行单元,用于执行以下训练步骤:将上述样本集合中的至少一个样本语音信息分别输入至初始神经网络模型,得到上述至少一个样本语音信息中的每个样本语音信息对应的预测信息,其中,预测信息表征样本语音信息为唤醒语音信息的概率;将上述至少一个样本语音信息中的每个样本语音信息对应的预测信息与标注信息进行比较;根据比较结果确定上述初始神经网络模型是否达到预设的优化目标;响应于确定上述初始神经网络模型达到预设的优化目标,将上述初始神经网络模型作为训练完成的神经网络模型。在一些实施例中,上述模型训练单元还包括:调整单元,用于响应于确定上述初始神经网络模型未达到预设的优化目标,调整上述初始神经网络模型的网络参数,以及继续执行上述训练步骤。在一些实施例中,上述标注信息包括第一标识和第二标识,其中,第一标识表征是唤醒语音信息,第二标识表征不是唤醒语音信息。在一些实施例中,上述二次判断结果包括确认唤醒和确认不唤醒;以及上述第二确定单元进一步用于:将上述语音信息发送到服务端,由上述服务端根据上述语音信息生成二次判断结果;接收上述二次判断结果;响应于确定上述二次判断结果为确认唤醒,执行唤醒操作。第四方面,本申请实施例提供了一种语音唤醒装置,包括:信息接收单元,用于接收终端发送的疑似唤醒语音信息;识别单元,用于将上述疑似唤醒语音信息进行语音识别,得到语音识别结果;匹配单元,用于将上述语音识别结果与上述终端的目标唤醒词进行匹配;信息发送单元,用于根据匹配结果向上述终端发送二次判断结果,由上述终端根据上述二次判断结果确定是否执行唤醒操作,其中,上述二次判断结果包括确认唤醒或确认不唤醒。在一些实施例中,上述信息发送单元进一步用于:响应于确定上述语音识别结果与上述目标唤醒词匹配成功,向上述终端发送确认唤醒;响应于确定上述语音识别结果与上述目标唤醒词匹配不成功,向上述终端发送确认不唤醒。第五方面,本申请实施例提供了一种终端,该终端包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。第七方面,本申请实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第二方面中任一实现方式描述的方法。第八方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第二方面中任一实现方式描述的方法。本申请实施例提供的语音唤醒方法和装置,首先基于接收到的用户的语音信息得到对应于所述语音信息的唤醒置信度,而后根据上述唤醒置信度确定上述语音信息是否为疑似唤醒语音信息,然后,响应于确定上述语音信息为疑似唤醒语音信息,对上本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,包括:接收用户的语音信息;基于所述语音信息得到对应于所述语音信息的唤醒置信度;根据所述唤醒置信度确定所述语音信息是否为疑似唤醒语音信息;响应于确定所述语音信息为疑似唤醒语音信息,对所述语音信息进行二次判断得到二次判断结果,根据所述二次判断结果确定是否执行唤醒操作。

【技术特征摘要】
1.一种语音唤醒方法,包括:接收用户的语音信息;基于所述语音信息得到对应于所述语音信息的唤醒置信度;根据所述唤醒置信度确定所述语音信息是否为疑似唤醒语音信息;响应于确定所述语音信息为疑似唤醒语音信息,对所述语音信息进行二次判断得到二次判断结果,根据所述二次判断结果确定是否执行唤醒操作。2.根据权利要求1所述的方法,其中,基于所述语音信息得到对应于所述语音信息的唤醒置信度,包括:将所述语音信息输入预先建立的识别模型,得到针对所述语音信息的唤醒置信度,其中,所述识别模型用于表征语音信息与唤醒置信度的对应关系。3.根据权利要求2所述的方法,其中,所述识别模型为神经网络模型,所述神经网络模型是通过以下方式训练得到的:获取样本集合,其中,样本包括样本语音信息和样本语音信息是否为唤醒语音信息的标注信息;执行以下训练步骤:将所述样本集合中的至少一个样本语音信息分别输入至初始神经网络模型,得到所述至少一个样本语音信息中的每个样本语音信息对应的预测信息,其中,预测信息表征样本语音信息为唤醒语音信息的概率;将所述至少一个样本语音信息中的每个样本语音信息对应的预测信息与标注信息进行比较;根据比较结果确定所述初始神经网络模型是否达到预设的优化目标;响应于确定所述初始神经网络模型达到预设的优化目标,将所述初始神经网络模型作为训练完成的神经网络模型。4.根据权利要求3所述的方法,其中,训练所述神经网络模型的步骤还包括:响应于确定所述初始神经网络模型未达到预设的优化目标,调整所述初始神经网络模型的网络参数,以及继续执行所述训练步骤。5.根据权利要求3所述的方法,其中,所述标注信息包括第一标识和第二标识,其中,第一标识表征是唤醒语音信息,第二标识表征不是唤醒语音信息。6.根据权利要求1所述的方法,其中,所述二次判断结果包括确认唤醒和确认不唤醒;以及所述对所述语音信息进行二次判断得到二次判断结果,根据所述二次判断结果确定是否执行唤醒操作,包括:将所述语音信息发送到服务端,由所述服务端根据所述语音信息生成二次判断结果;接收所述二次判断结果;响应于确定所述二次判断结果为确认唤醒,执行唤醒操作。7.一种语音唤醒方法,包括:接收终端发送的疑似唤醒语音信息;将所述疑似唤醒语音信息进行语音识别,得到语音识别结果;将所述语音识别结果与所述终端的目标唤醒词进行匹配;根据匹配结果向所述终端发送二次判断结果,由所述终端根据所述二次判断结果确定是否执行唤醒操作,其中,所述二次判断结果包括确认唤醒或确认不唤醒。8.根据权利要求7所述的方法,其中,所述根据匹配结果向所述终端发送二次判断结果,包括:响应于确定所述语音识别结果与所述目标唤醒词匹配成功,向所述终端发送确认唤醒;响应于确定所述语音识别结果与所述目标唤醒词匹配不成功,向所述终端发送确认不唤醒。9.一种语音唤醒装置,包括:接收单元,用于接收用户的语音信息;生成单元,用于基于所述语音信息得到对应于所述语音信息的唤醒置信度;第一确定单元,用于根据所述唤醒置信度确定所述语音信息是否为疑似唤醒语音信息;第二确定单元,用于响应于确定所述语音信息为疑似唤醒语音信息,对所述语音信息进行二次判断得到二次判断结果,根据所述二次判断结果确定是否执行唤醒...

【专利技术属性】
技术研发人员:李俊杨锐赵立峰陈晓建曹玉书
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1