一种语音唤醒方法、电子设备及芯片系统技术方案

技术编号:35682713 阅读:16 留言:0更新日期:2022-11-23 14:26
本申请提供一种语音唤醒方法、电子设备及芯片系统,涉及语音控制技术领域;该方法可以在支持设置自定义唤醒词的电子设备中,设置一个或多个自定义唤醒词,并在注册该自定义唤醒词时为自定义唤醒词设置较大的声纹阈值,在后续唤醒过程中,将电子设备中已经验证过的语音模板作为先验信息,以进一步判断接收到的唤醒语音是否能够将电子设备的语音功能唤醒,在接收到的唤醒语音能够将电子设备的语音功能唤醒的情况下,可以基于该接收到的唤醒语音进一步调整该自定义唤醒词的声纹阈值,以得到更为合适的声纹阈值;从而降低自定义唤醒词对应的语音唤醒失败的情况。语音唤醒失败的情况。语音唤醒失败的情况。

【技术实现步骤摘要】
一种语音唤醒方法、电子设备及芯片系统


[0001]本申请涉及语音控制
,尤其涉及一种语音唤醒方法、电子设备及芯片系统。

技术介绍

[0002]随着用户的需求增多,智能电子设备的功能越来越强大。例如,用户可以不通过电子设备上的按钮(或按键)、遥控器等控制电子设备,而是通过语音控制电子设备。当然,通过语音控制电子设备时,首先需要通过唤醒词唤醒电子设备的语音功能。
[0003]通常,电子设备在出厂时,生产厂家会为电子设备的语音助手设置初始唤醒词、打分策略以及声纹阈值等,用户也可以根据个人喜好自定义唤醒词。然而,用户自定义唤醒词的声纹阈值通常设置较为不合理,导致用户通过自定义唤醒词唤醒电子设备的语音功能时,常常出现唤醒失败的现象。

技术实现思路

[0004]本申请提供一种语音唤醒方法、电子设备及芯片系统,可以降低自定义唤醒词唤醒失败的现象。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供一种语音唤醒方法,包括:
[0007]在注册阶段,接收到第一语音,将第一语音生成第一唤醒词的第一模板,为第一唤醒词设置第一阈值,第一阈值用于在非注册阶段判断接收到的语音是否可以作为第一唤醒词对应的语音唤醒电子设备的语音功能;
[0008]在非注册阶段,接收到第二语音,计算第二语音和第一模板的第一声纹匹配分值;
[0009]若第一声纹匹配分值小于第一阈值,则计算第二语音和第一先验信息的第二声纹匹配分值,以及第一模板和第一先验信息的第三声纹匹配分值,第一先验信息包括该电子设备中存储的至少一个模板,第一先验信息不包括第一模板;
[0010]计算基于同一第一先验信息的第二声纹匹配分值和第三声纹匹配分值的第一差异值;
[0011]若第一差异值小于差异阈值的比例大于预设比例,则第二语音作为第一唤醒词的语音成功唤醒该电子设备的语音功能,将第二语音生成第一唤醒词的第二模板,更新第一唤醒词的第一阈值为第一声纹匹配分值。
[0012]本申请中,可以在支持自定义唤醒词(例如,第一唤醒词)的电子设备中,录入语音信息(例如,第一语音),将录入的语音信息生成语音模板(例如,第一模板),并为设置的自定义唤醒词设置声纹阈值(例如,第一阈值);在后续唤醒过程中,可以将接收到的语音信息(例如,第二语音)与生成的第一模板进行匹配,由于预先设置的第一阈值不太合理,导致匹配结果大概率会小于该第一阈值,从而唤醒失败;为了降低唤醒失败的情况下发生,在小于该第一阈值的情况下,可以将接收到的第二语音和第一模板基于同一先验信息计算声纹匹
配分值,若两类声纹匹配分值相差较大,则说明,第二语音和第一模板差异较大,若两类声纹匹配分值相差较小,则说明第二语音和第一模板差异较小。在第二语音和第一模板差异较小的情况下,就可以唤醒电子设备;同时,还可以将与第一模板差异较小的第二语音进一步生成该自定义唤醒词的第二模板;同时还可以调整该自定义唤醒词的第一阈值为第二语音和第一模板之间的声纹匹配分值;从而使得第一阈值更合适,已在后续的唤醒流程中,降低唤醒失败的情况。
[0013]作为第一方面的另一实现方式,该电子设备中设置有初始唤醒词,初始唤醒词设置有初始模板和初始阈值;
[0014]第一阈值为该电子设备中的每个唤醒词的阈值的均值和第一系数的乘积,第一系数大于1;
[0015]或,第一阈值为初始唤醒词的初始阈值和第一系数的乘积;
[0016]或,第一阈值为第一值,第一值大于初始阈值。
[0017]本申请中,若将第一阈值设置的较小,则可能出现误唤醒的情况,例如,随便接收到的语音和模板的声纹匹配分值大于该第一阈值。鉴于本申请中,即使接收到的语音和模板的声纹匹配分值小于第一阈值,也可以通过同一先验信息的方式判断接收的语音和模板的相似度,并在该相似度较大时调整该第一阈值,因此,可以将第一阈值设置的较大。
[0018]作为第一方面的另一实现方式,在计算第二语音和第一模板的第一声纹匹配分值之前,该方法还包括:
[0019]将第二语音转换为第一文本信息;
[0020]基于第一文本信息,确定第二语音为第一唤醒词对应的语音;
[0021]或者;
[0022]计算第二语音和初始模板的第一初始声纹匹配分值;
[0023]确定第一初始声纹匹配分值小于初始阈值。
[0024]本申请中,电子设备中可能存储至少一个唤醒词的模板,因此,在实际应用中,可以将接收到的语音转化为文本,从而确定该文本和哪个唤醒词匹配,从而确定该语音属于哪个唤醒词对应的语音,从容可以直接执行该语音与对应的唤醒词之间的匹配流程。当然,本申请还提供多样化的方式,例如,可以依次执行该语音与各个唤醒词之间的匹配流程,直到将每个唤醒词匹配结束或者直到唤醒电子设备的语音功能。
[0025]作为第一方面的另一实现方式,在计算第二语音和第一模板的第一声纹匹配分值之后,该方法还包括:
[0026]若第一声纹匹配分值大于或等于第一阈值,则第二语音作为第一唤醒词的语音唤醒该电子设备的语音功能。
[0027]作为第一方面的另一实现方式,在计算基于同一第一先验信息的第二声纹匹配分值和第三声纹匹配分值的第一差异值之后,该方法还包括:
[0028]若第一差异值小于差异阈值的比例小于或等于预设比例,则第二语音作为第一唤醒词的语音唤醒该电子设备的语音功能失败。
[0029]作为第一方面的另一实现方式,若第一差异值小于差异阈值的比例大于预设比例,在将第二语音作为第一唤醒词的语音成功唤醒该电子设备的语音功能之前,该方法还包括:
[0030]确定第二语音的信噪比大于信噪比阈值。
[0031]本申请中,通过设置信噪比阈值的方式,可以降低误唤醒的情况发生。
[0032]作为第一方面的另一实现方式,在将第二语音生成第一唤醒词的第二模板,更新第一唤醒词的第一阈值为第一声纹匹配分值之后,该方法包括:
[0033]在非注册阶段,接收第三语音,计算第三语音和第一唤醒词的比对模板的第四声纹匹配分值,第一唤醒词的比对模板包括第一模板和/或第二模板;
[0034]若第四声纹匹配分值小于第一阈值,则计算第三语音和第二先验信息的第五声纹匹配分值,以及第一唤醒词的比对模板和第二先验信息的第六声纹匹配分值,第二先验信息包括该电子设备中存储的至少一个模板,第二先验信息不包括第一唤醒词的比对模板;
[0035]计算基于同一第二先验信息的第五声纹匹配分值和第六声纹匹配分值的第二差异值;
[0036]若第二差异值小于差异阈值的比例大于预设比例,则第三语音作为第一唤醒词的语音成功唤醒该电子设备的语音功能,将第三语音生成第一唤醒词的第三模板,更新第一唤醒词的第一阈值为第四声纹匹配分值;
[0037]若第二差异值小于差异阈值的比例小于或等于预设比例,则第三语音作为第一唤醒词的语音唤醒该电子设备的语音功能失败。
[0038]作为第一方面的另一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:在注册阶段,接收到第一语音,将所述第一语音生成第一唤醒词的第一模板,为所述第一唤醒词设置第一阈值,所述第一阈值用于在非注册阶段判断接收到的语音是否可以作为所述第一唤醒词对应的语音唤醒电子设备的语音功能;在非注册阶段,接收到第二语音,计算所述第二语音和所述第一模板的第一声纹匹配分值;若所述第一声纹匹配分值小于所述第一阈值,则计算所述第二语音和第一先验信息的第二声纹匹配分值,以及所述第一模板和所述第一先验信息的第三声纹匹配分值,所述第一先验信息包括所述电子设备中存储的至少一个模板,所述第一先验信息不包括所述第一模板;计算基于同一第一先验信息的所述第二声纹匹配分值和所述第三声纹匹配分值的第一差异值;若所述第一差异值小于差异阈值的比例大于预设比例,则所述第二语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能,将所述第二语音生成所述第一唤醒词的第二模板,更新所述第一唤醒词的第一阈值为所述第一声纹匹配分值。2.如权利要求1所述的方法,其特征在于,所述电子设备中设置有初始唤醒词,所述初始唤醒词设置有初始模板和初始阈值;所述第一阈值为所述电子设备中的每个唤醒词的阈值的均值和第一系数的乘积,所述第一系数大于1;或,所述第一阈值为所述初始唤醒词的初始阈值和所述第一系数的乘积;或,所述第一阈值为第一值,所述第一值大于所述初始阈值。3.如权利要求2所述的方法,其特征在于,在计算所述第二语音和所述第一模板的第一声纹匹配分值之前,所述方法还包括:将所述第二语音转换为第一文本信息;基于所述第一文本信息,确定所述第二语音为所述第一唤醒词对应的语音;或者,计算所述第二语音和所述初始模板的第一初始声纹匹配分值;确定所述第一初始声纹匹配分值小于所述初始阈值。4.如权利要求1所述的方法,其特征在于,在计算所述第二语音和所述第一模板的第一声纹匹配分值之后,所述方法还包括:若所述第一声纹匹配分值大于或等于所述第一阈值,则所述第二语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能。5.如权利要求1所述的方法,其特征在于,在计算基于同一第一先验信息的所述第二声纹匹配分值和所述第三声纹匹配分值的第一差异值之后,所述方法还包括:若所述第一差异值小于所述差异阈值的比例小于或等于所述预设比例,则所述第二语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能失败。6.如权利要求1所述的方法,其特征在于,若所述第一差异值小于差异阈值的比例大于预设比例,在将所述第二语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能之前,所述方法还包括:
确定所述第二语音的信噪比大于信噪比阈值。7.如权利要求1所述的方法,其特征在于,在将所述第二语音生成所述第一唤醒词的第二模板,更新所述第一唤醒词的第一阈值为所述第一声纹匹配分值之后,所述方法包括:在非注册阶段,接收第三语音,计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值,所述第一唤醒词的比对模板包括所述第一模板和/或所述第二模板;若所述第四声纹匹配分值小于所述第一阈值,则计算所述第三语音和第二先验信息的第五声纹匹配分值,以及所述第一唤醒词的比对模板和所述第二先验信息的第六声纹匹配分值,所述第二先验信息包括所述电子设备中存储的至少一个模板,所述第二先验信息不包括所述第一唤醒词的比对模板;计算基于同一第二先验信息的所述第五声纹匹配分值和所述第六声纹匹配分值的第二差异值;若所述第二差异值小于所述差异阈值的比例大于所述预设比例,则所述第三语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能,将所述第三语音生成所述第一唤醒词的第三模板,更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值;若所述第二差异值小于所述差异阈值的比例小于或等于所述预设比例,则所述第三语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能失败。8.如权利要求7所述的方法,其特征在于,所述第一唤醒词的比对模板包括所述第一模板和所述第二模板,所述第四声纹匹配分值为:所述第三语音和所述第一模板的声纹匹配分值以及所述第三语音信息和所述第二模板的声纹匹配分值的均值。9.如权利要求7所述的方法,其特征在于,在计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值之前,所述方法还包括:将所述第三语音转换为第二文本信息;基于所述第二文本信息,确定所述第三语音为所述第一唤醒词对应的语音。10.如权利要求7所述的方法,其特征在于,所述第一唤醒词的比对模板包括所述第一模板和所述第二模板;所述第二先验信息包括:所述电子设备的初始唤醒词的初始模板;所述第六声纹匹配分值包括与所述第一模板对应的第六一声纹匹配分值和与所述第二模板对应的第六二声纹匹配分值;所述计算基于同一第二先验信息的所述第五声纹匹配分值和所述第六声纹匹配分值的第二差异值包括:计算基于所述初始模板第五声纹匹配分值和第六一声纹匹配分值的第二一差异值;计算基于所述初始模板的第五声纹匹配分值和第六二声纹匹配分值的第二二差异值;所述第二差异值包括所述第二一差异值和所述第二二差异值。11.如权利要求7所述的方法,其特征在于,在计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值之后,所述方法还包括:若所述第四声纹匹配分值大于或等于所述第一阈值,所述第三语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能。12.如权利要求7至11任一项所述的方法,其特征在于,在将所述第三语音生成所述第一唤醒词的第三模板,更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值之前,所述方法还包括:确定所述第一唤醒词的模板的数量小于数量阈值;
相应的,所述方法还包括:若确定所述第一唤醒词的模板的数量不小于所述数量阈值,则更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值,不再将所述第三语音生成所述第一唤醒词的第三模板。13.如权利要求12所述的方法,其特征在于,若更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值,不再将所述第三语音生成所述第一唤醒词的第三模板之后,所述方法还包括:在非注册阶段,接收第四语音,计算所述第四语音和所述第一唤醒词的比对模板的第七声纹...

【专利技术属性】
技术研发人员:王耀光夏日升
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1