设备唤醒方法、装置及电子设备制造方法及图纸

技术编号:37062924 阅读:29 留言:0更新日期:2023-03-29 19:41
本公开提供了一种设备唤醒方法、装置以及电子设备,所述方法包括:基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;其中,所述唤醒判定用于确定是否唤醒设备,所述误唤醒判定用于对所述唤醒判定进行唤醒纠错;基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备。确定是否唤醒所述设备。确定是否唤醒所述设备。

【技术实现步骤摘要】
设备唤醒方法、装置及电子设备


[0001]本公开涉及通信
,特别是涉及一种设备唤醒方法、装置以及电子设备。

技术介绍

[0002]随着人工智能(AI)算法以及AI芯片等硬件技术的发展,智能设备已经在日常生活中被广泛应用,如智能家居、智能音箱、智能会议系统等。其中,语音交互在智能设备中的应用逐渐变得广泛,具体而言,基于语音进行设备的唤醒也应运而生。

技术实现思路

[0003]本公开提供一种设备唤醒方法,所述方法包括:
[0004]基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;其中,所述唤醒判定用于确定是否唤醒设备,所述误唤醒判定用于对所述唤醒判定进行唤醒纠错;
[0005]基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备。
[0006]可选地,所述基于当前采集到的语音数据,进行所述误唤醒判定;包括:
[0007]对所述当前采集到的语音数据进行至少一种分析维度的初判定,所述初判定用于确定是否为误唤醒;
[0008]基于所述至少一种分析维度各自对应的判定结果,进行所述误唤醒判定。
[0009]可选地,所述分析维度包括:语音内容维度,所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:
[0010]从所述当前采集到的语音数据中提取语音向量特征;
[0011]获取多个预设向量特征,其中,所述预设向量特征为预先确定的非唤醒的语音数据对应的向量特征;
[0012]基于所述语音向量特征分别与多个预设向量特征对应的相似度,从所述语音内容维度判定是否为误唤醒。
[0013]可选地,所述分析维度包括语境维度;所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:
[0014]对所述当前采集到的语音数据进行文本识别,得到多个文本词;
[0015]基于多个所述文本词,获取语义特征,所述语义特征用于表征各个所述文本词之间的相关性程度;
[0016]基于所述语义特征,从所述语境维度判定是否为误唤醒。
[0017]可选地,所述对所述当前采集到的语音数据进行内容识别,得到多个文本词之后,所述方法还包括:
[0018]基于所述当前采集的语音数据的时间,获取多个所述文本词各自对应的采集时间;
[0019]基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,所述时间特征用于表征多个所述文本词之间的时间连续程度;
[0020]基于所述语义特征,从所述语境维度判定是否为误唤醒,包括:
[0021]基于所述语义特征和所述时间特征,从所述语境维度判定是否为误唤醒。
[0022]可选地,所述基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,包括:
[0023]从多个所述文本词中,确定目标词;其中,所述目标词为与所述设备的唤醒词对应的文本词;
[0024]基于多个所述文本词各自对应的采集时间,确定所述目标词与其他所述文本词之间的第一时间间隔,将所述第一时间间隔确定为所述时间特征;和/或,
[0025]基于多个所述文本词各自对应的采集时间,确定每相邻的两个所述文本词之间的第二时间间隔,将所述第二时间间隔确定为所述时间特征;
[0026]其中,其他所述文本词为除所述目标词外的任一文本词。
[0027]可选地,基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定,包括:
[0028]将所述当前采集到的语音数据分别输入至唤醒模型和误唤醒模型,以通过所述唤醒模型进行所述唤醒判定,通过所述误唤醒模型进行所述误唤醒判定;
[0029]其中,所述唤醒模型是以多个唤醒语音数据为训练样本训练得到的,所述误唤醒模型是以多个误唤醒的语音数据样本为训练样本训练得到的。
[0030]可选地,所述误唤醒的语音数据样本的获取,包括:
[0031]在每成功唤醒所述设备时,对唤醒所述设备的第一语音数据进行缓存;
[0032]从至少一个所述第一语音数据中,确定属于误唤醒的第二语音数据;
[0033]将所述第二语音数据作为所述误唤醒的语音数据样本。
[0034]可选地,所述从保存的至少一个所述第一语音数据中,确定属于误唤醒的第二语音数据,包括:
[0035]输出针对至少一个所述第一语音数据的语音播报信息;
[0036]基于针对所述第一语音数据的用户反馈信息,确定所述第二语音数据;
[0037]其中,所述语音播报信息用于指示用户确认每个所述第一语音数据是否为误唤醒的语音数据。
[0038]可选地,在每成功唤醒所述设备时,所述方法还包括:
[0039]对预设时长内产生的语音进行采集,得到所述第一语音数据对应的用户响应语音;
[0040]所述至少一个所述第一语音数据中,确定属于误唤醒的第二语音数据,包括:
[0041]从至少一个所述第一语音数据各自对应的用户响应语音中,确定包括预设语音内容的目标用户响应语音;
[0042]将所述目标用户响应语音对应的第一语音数据,确定为所述第二语音数据。
[0043]可选地,所述唤醒判定的结果包括唤醒概率,所述误唤醒判定的结果包括误唤醒概率,基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备,包括:
[0044]获取与所述唤醒判定对应的第一阈值和所述误唤醒判定对应的第二阈值;
[0045]基于所述唤醒概率、所述误唤醒概率、所述第一阈值和所述第二阈值,确定是否唤醒所述设备。
[0046]可选地,所述第一阈值大于所述第二阈值。
[0047]可选地,基于所述唤醒概率、所述误唤醒概率、所述第一阈值和所述第二阈值,确定是否唤醒所述设备,包括:
[0048]在所述唤醒概率大于等于所述第一阈值,且所述误唤醒概率小于所述第二阈值的情况下,唤醒所述设备;
[0049]在所述唤醒概率大于或等于所述第一阈值,且所述误唤醒概率大于或等于所述第二阈值的情况下,基于所述唤醒概率与所述误唤醒概率之间的大小关系,确定是否唤醒所述设备。
[0050]本公开还提供一种设备唤醒装置,所述装置包括:
[0051]判定模块,用于基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;其中,所述唤醒判定用于确定是否唤醒设备,所述误唤醒判定用于对所述唤醒判定进行唤醒纠错;
[0052]执行模块,用于基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备
[0053]本公开还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现所述的设备唤醒方法。
[0054]采用本申请实施例的设备唤醒方法,可以基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒设备,若确定是唤醒设备,则进行设备的唤醒本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备唤醒方法,其特征在于,所述方法包括:基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;其中,所述唤醒判定用于确定是否唤醒设备,所述误唤醒判定用于对所述唤醒判定进行唤醒纠错;基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备。2.根据权利要求1所述的方法,其特征在于,所述基于当前采集到的语音数据,进行所述误唤醒判定;包括:对所述当前采集到的语音数据进行至少一种分析维度的初判定,所述初判定用于初步确定是否为误唤醒;基于所述至少一种分析维度各自对应的判定结果,进行所述误唤醒判定。3.根据权利要求2所述的方法,其特征在于,所述分析维度包括:语音内容维度,所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:从所述当前采集到的语音数据中提取语音向量特征;获取多个预设向量特征,其中,所述预设向量特征为预先确定的非唤醒的语音数据对应的向量特征;基于所述语音向量特征分别与多个预设向量特征之间的相似度,从所述语音内容维度判定是否为误唤醒。4.根据权利要求2或3所述的方法,其特征在于,所述分析维度包括语境维度;所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:对所述当前采集到的语音数据进行文本识别,得到多个文本词;基于多个所述文本词,获取语义特征,所述语义特征用于表征各个所述文本词之间的相关性程度;基于所述语义特征,从所述语境维度判定是否为误唤醒。5.根据权利要求4所述的方法,其特征在于,所述对所述当前采集到的语音数据进行内容识别,得到多个文本词之后,所述方法还包括:基于所述当前采集的语音数据的时间,获取多个所述文本词各自对应的采集时间;基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,所述时间特征用于表征多个所述文本词之间的时间连续程度;基于所述语义特征,从所述语境维度判定是否为误唤醒,包括:基于所述语义特征和所述时间特征,从所述语境维度判定是否为误唤醒。6.根据权利要求5所述的方法,其特征在于,所述基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,包括:从多个所述文本词中,确定目标词;其中,所述目标词为与所述设备的唤醒词对应的文本词;基于多个所述文本词各自对应的采集时间,确定所述目标词与其他所述文本词之间的第一时间间隔,将所述第一时间间隔确定为所述时间特征;和/或,基于多个所述文本词各自对应的采集时间,确定每相邻的两个所述文本词之间的第二时间间隔,将所述第二时间间隔确定为所述时间特征;其中,其他所述文本词为除所述目标词外的任一文本词。7.根据权利要求1或2所述的方法,其特征在于,基于当前采集到的语音数据,分别进行
唤醒判定和误唤醒判定,包括:将所述当前采集到的语音数据分别输入至唤醒模型和误唤醒模型,以通过所述唤醒模型进行所述唤醒判定,通过所...

【专利技术属性】
技术研发人员:宿绍勋
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1