一种智能设备唤醒方法及装置制造方法及图纸

技术编号:35087954 阅读:22 留言:0更新日期:2022-10-01 16:42
本发明专利技术公开了人工智能领域中的一种智能设备唤醒方法及装置,方法包括:接收包含唤醒词的第一语音,唤醒词是预先设置的用于唤醒智能设备的词;获取第一语音中包含的唤醒词的置信度;根据第一语音对应的上一轮的交互意图,确定第一场景和第一场景对应的唤醒阈值;其中,上一轮的交互意图是第二语音对应的交互意图,第二语音是在接收第一语音之前接收的语音,第二语音包含用于控制智能设备执行操作的指令性语句,第一场景是上一轮的交互意图对应的场景;在置信度大于唤醒阈值的情况下,唤醒智能设备。上述技术方案实现了基于上一轮的交互意图,确定相应的场景及场景对应的唤醒阈值,从而根据置信度和唤醒阈值确定是否唤醒智能设备。能设备。能设备。

【技术实现步骤摘要】
一种智能设备唤醒方法及装置


[0001]本专利技术涉及人工智能领域的人机交互技术,特别涉及一种智能设备唤醒方法及装置

技术介绍

[0002]人机交互作为人工智能领域的一个研究方向,从以个人计算机(Personal Computer,PC)、智能手机等为代表的通过键盘、鼠标、触摸屏等交互,发展到以智能对话系统,如手机语音助手、智能音箱、智慧大屏、智能车载等为代表的语音交互。语音交互前,用户需要通过语音,如“嗨,小艺同学”等唤醒词唤醒智能设备,使智能设备从休眠状态进入工作状态,智能设备才能正常地处理用户指令。因此,语音唤醒效果的好坏很大程度上影响语音交互的用户体验。
[0003]智能设备预先设置有唤醒模型,将采集到的用户语音输入唤醒模型,得到用户语音包括的唤醒词的置信度。如果唤醒词的置信度大于唤醒阈值,则唤醒智能设备,智能设备进入能正常处理用户指令的状态。常用的唤醒模型有隐马尔科夫(Hidden Markov Model,HMM)模型、深度神经网络(Deep Neural Networks,DNN)模型等统计模型。当前大部分方案中唤醒阈值为一个固定的值,如果唤醒阈值设置的过高,则在如用户聚会等人员众多的场景,由于语音语色不一致,来自各方的音源混合在一起,极易造成智能设备难以被唤醒;如果唤醒阈值设置的较低,则在如用户休息等比较安静的场景,易造成误唤醒。由此可见,固定的唤醒阈值不足以满足不同用户、不同环境下对唤醒阈值的需求,造成较差的用户体验。

技术实现思路

[0004]本专利技术实施例提出一种智能设备唤醒方法及装置,用于解决固定的唤醒阈值不足以满足不同用户、不同环境下对唤醒阈值的需求,造成较差的用户体验的问题。该技术方案如下:
[0005]第一方面,本申请实施例提出一种智能设备唤醒方法,应用于智能设备,该方法包括:
[0006]接收包含唤醒词的第一语音,此处所述唤醒词是预先设置的用于唤醒所述智能设备的词;
[0007]获取第一语音中包含的唤醒词的置信度;
[0008]根据第一语音对应的上一轮的交互意图,确定第一场景和第一场景对应的唤醒阈值;其中,上一轮的交互意图是第二语音对应的交互意图,第二语音是在接收第一语音之前接收的语音,第二语音包含用于控制所述智能设备执行操作的指令性语句,第一场景是上一轮的交互意图对应的场景;
[0009]在所述置信度大于所述唤醒阈值的情况下,唤醒所述智能设备。
[0010]上述技术方案实现了基于上一轮的交互意图,确定相应的场景及场景对应的唤醒阈值,从而根据置信度和唤醒阈值确定是否唤醒智能设备。
[0011]在一种可能的实现中,所述唤醒阈值包括基于历史交互行为数据自动更新的阈值,此处所述历史交互行为数据包括“场景触发”次数和“场景

唤醒事件对”次数,“场景触发”次数为某一场景的累计触发次数,“场景

唤醒事件对”次数为某一场景下智能设备的累计唤醒次数。
[0012]在一种可能的实现中,该方法还包括:
[0013]在唤醒所述智能设备的情况下,更新第一场景对应的“场景触发”次数和“场景

唤醒事件对”次数;
[0014]根据更新后的第一场景对应的“场景触发”次数和“场景

唤醒事件对”次数,更新第一场景对应的唤醒阈值,从而实现了基于历史交互行为数据,自动调节唤醒阈值的效果。
[0015]在一种可能的实现中,上述根据更新后的第一场景对应的“场景触发”次数和“场景

唤醒事件对”次数,更新第一场景对应的唤醒阈值,具体包括:
[0016]根据更新后的第一场景对应的“场景触发”次数和“场景

唤醒事件对”次数,更新第一场景对应的唤醒概率;
[0017]根据更新后的第一场景对应的所述智能设备的唤醒概率,更新第一场景对应的唤醒阈值。
[0018]在该可能的实现中,先基于历史交互行为数据,自动调节第一场景对应的唤醒概率,再根据调节后的唤醒概率,自动调节第一场景对应的唤醒阈值。
[0019]在一种可能的实现中,上述第一场景对应的唤醒概率基于如下公式计算得到:
[0020][0021]其中,所述P(w|c1)用于表示第一场景对应的唤醒概率,所述n(c1,w)用于表示第一场景对应的“场景

唤醒事件对”次数,所述n(c1)用于表示第一场景对应的“场景触发”次数。
[0022]在一种可能的实现中,上述第一场景对应的唤醒阈值基于如下公式计算得到:
[0023][0024]其中,所述用于表示第一场景对应的唤醒阈值,所述用于表示日常待机场景对应的唤醒阈值,所述日常待机场景对应的唤醒阈值为0.5,所述P(w|c1)用于表示第一场景对应的唤醒概率,所述P(w|c0)用于表示日常待机场景对应的唤醒概率,α用于表示调节幅度。
[0025]在一种可能的实现中,该方法还包括:
[0026]记录第一语音对应的第一唤醒事件,和确定第一语音对应的第一唤醒事件的第一时刻。
[0027]在一种可能的实现中,该方法还包括:
[0028]确定第一时刻和第二时刻的时间差,其中,第二时刻是确定第二语音对应的交互意图的时刻;
[0029]在时间差小于预设时间阈值的情况下,确定第一语音和第二语音处于同一会话。
[0030]第二方面,本专利技术实施例还提出一种智能设备唤醒装置,包括至少一个处理器,所述处理器用于执行存储器中存储的指令,以使得上述通信装置执行:
[0031]如第一方面所述的方法及各种可能的实现中的各个步骤。
[0032]第三方面,本专利技术实施例提出一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行:
[0033]如第一方面所述的方法及各种可能的实现中的各个步骤。
[0034]第四方面,本申请实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,如第一方面所述的方法及各种可能的实现中的各个步骤被执行。
附图说明
[0035]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本专利技术实施例提供的一种人工智能主体框架示意图;
[0037]图2为本专利技术实施例提供的自动调节唤醒灵敏度的系统架构图;
[0038]图3为本专利技术实施例提供的灵敏度控制模块的详细结构示意图;
[0039]图4为本专利技术实施例提供的一种智能设备唤醒方法的流程示意图;
[0040]图5为本专利技术实施例提供的一种智能设备唤醒方法的另一流程示意图。
具体实施方式
[0041]下面将结合本专利技术实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能设备唤醒方法,应用于智能设备,其特征在于,所述方法包括:接收包含唤醒词的第一语音,所述唤醒词是预先设置的用于唤醒所述智能设备的词;获取所述第一语音中包含的唤醒词的置信度;根据所述第一语音对应的上一轮的交互意图,确定第一场景和所述第一场景对应的唤醒阈值;其中,所述上一轮的交互意图是第二语音对应的交互意图,所述第二语音是在接收所述第一语音之前接收的语音,所述第二语音包含用于控制所述智能设备执行操作的指令性语句,所述第一场景是所述上一轮的交互意图对应的场景;在所述置信度大于所述唤醒阈值的情况下,唤醒所述智能设备。2.根据权利要求1所述的方法,其特征在于,所述唤醒阈值包括基于历史交互行为数据自动更新的阈值,所述历史交互行为数据包括“场景触发”次数和“场景

唤醒事件对”次数,所述“场景触发”次数为某一场景的累计触发次数,所述“场景

唤醒事件对”次数为某一场景下智能设备的累计唤醒次数。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在唤醒所述智能设备的情况下,更新所述第一场景对应的所述“场景触发”次数和所述“场景

唤醒事件对”次数;根据更新后的所述第一场景对应的所述“场景触发”次数和所述“场景

唤醒事件对”次数,更新所述第一场景对应的唤醒阈值。4.根据权利要求3所述的方法,其特征在于,所述根据更新后的所述第一场景对应的所述“场景触发”次数和所述“场景

唤醒事件对”次数,更新所述第一场景对应的唤醒阈值,具体包括:根据更新后的所述第一场景对应的所述“场景触发”次数和所述“场景

唤醒事件对”次数,更新所述第一场景对应的唤醒概率;根据更新后的所述第一场景对应的所述智能设备的唤醒概率,更新所述第一场景对应的唤醒阈值。5.根据权...

【专利技术属性】
技术研发人员:晏小辉袁牧人宋凯凯
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1