【技术实现步骤摘要】
两阶段的用户可定制唤醒词检测
[0001]相关申请
[0002]本申请要求于2020年5月6日提交的美国临时专利申请第63/020,984号的优先权,该美国临时专利申请的全部公开内容特此被并入本文。
[0003]本公开总体上涉及语音识别系统,并且更具体地涉及唤醒词检测。
技术介绍
[0004]越来越多的现代计算设备以语音识别能力为特征,允许用户经由话音命令和自然语音执行各种各样的计算任务。诸如移动电话或智能扬声器之类的设备提供集成虚拟助理,这些集成虚拟助理可以通过在局域网和/或广域网上通信来响应于用户的命令或自然语言请求,以取回被请求的信息或者控制其它设备,例如灯、暖气和空调控制、音频或视频装备等。具有语音识别能力的设备通常保持在低功耗模式下,直到说出了特定词或短语(即,唤醒词或唤醒短语),从而允许用户在设备因此被激活之后使用话音命令来控制设备。
[0005]为了发起基于话音的用户接口,通常会部署唤醒词检测(WWD)。这里,关键词或关键短语被连续地监测,并且当被检测到时,启用进一步的基于话音的交互。早 ...
【技术保护点】
【技术特征摘要】
1.一种方法,包括:确定被配置为基于训练发声集合来识别短语的第一模型;使用所述第一模型分析所述训练发声集合以确定第二模型,所述第二模型包括所述训练发声集合中的每一个的参数;以及基于所述第一模型和所述第二模型的连结来确定检测到的发声是否对应于所述短语。2.根据权利要求1所述的方法,其中,所述参数包括训练状态序列,使得所述第二模型包括针对所述训练发声集合中的每一个的训练状态序列,并且其中,每个训练状态序列指示对应训练发声的每个时间间隔的可能状态。3.根据权利要求2所述的方法,其中,确定所述检测到的发声是否对应于所述短语包括:确定所述检测到的发声的状态序列,所述状态序列指示所述检测到的发声的每个时间间隔的可能状态;以及确定每个训练状态序列和所述检测到的发声的所述状态序列之间的距离,以生成距离集合。4.根据权利要求3所述的方法,其中,确定所述检测到的发声是否对应于所述短语进一步包括:使用所述第一模型来确定所述检测到的发声的似然比;以及至少部分地基于所述检测到的发声的所述似然比和所述距离集合之中的最小距离,来确定所述检测到的发声是否对应于所述短语。5.根据权利要求4所述的方法,其中,确定所述距离集合之中的所述最小距离低于阈值指示所述检测到的发声对应于所述短语。6.根据权利要求1所述的方法,其中,所述参数包括随时间的似然比,使得所述第二模型包括对所述训练发声集合中的每一个的随时间的似然比的指示。7.根据权利要求6所述的方法,其中,确定所述检测到的发声是否对应于所述短语包括:确定所述检测到的发声的随时间的似然比;以及确定每个训练发声的随时间的似然比和所述检测到的发声的随时间的似然比之间的距离,以生成距离集合。8.根据权利要求7所述的方法,其中,确定所述检测到的发声是否对应于所述短语进一步包括:使用所述第一模型来确定所述检测到的发声的似然比;以及至少部分地基于所述检测到的发声的所述似然比和所述距离集合之中的最小距离,来确定所述检测到的发声是否对应于所述短语。9.一种系统,包括:存储器;以及处理设备,其可操作地耦合到所述存储器,所述处理设备被配置为:确定被配置为基于训练发声集合来识别短语的第一模型;使用所述第一模型分析所述训练发声集合以确定第二模型,所述第二模型包括针对所述训练发声集合中的每一个的训练状态序列,并且其中,每个训练状态序列指示对应训练
发声的每个时间间隔的可能状态;以及基于所述第一模型和所述第二模型的连结来确定检测到的发声是否对应于所述短语。10.根据权利要求9所述的系统,其中,为了确定所述检测到的发声是否对应于所述短语,所述处理设备被配置为:确定所述检测到的发声的状态序列,所述状态序列指示所述检测到的发声的每个时间间隔的可能状态;以及确定每个训练状态序列和所述检测到的发声的所述状态序列之间的距离,以生成距离集合。11.根据权利要求10所述的系统,其中,为了确定所述检测到的发声是否对应于所述短语,所述处理设备被进一步配置为:使用所述第一模型来确定所述检测到的发声的似然比;以及至少部分地基于所述检测到的发声的所述似然比和所述距离集合之中的最小距离,来确定所述检测到的发声是否对应于所述短语。12.根据权利要求11所述的系统,其中,所述处理设备被进一步配置为:将所述距离集合之中的确定距离与阈值进行比较;并且响应于确定所述距离集合之...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。