一种语音唤醒方法、电子设备及芯片系统技术方案

技术编号：35682713 阅读：16 留言：0更新日期：2022-11-23 14:26

本申请提供一种语音唤醒方法、电子设备及芯片系统，涉及语音控制技术领域；该方法可以在支持设置自定义唤醒词的电子设备中，设置一个或多个自定义唤醒词，并在注册该自定义唤醒词时为自定义唤醒词设置较大的声纹阈值，在后续唤醒过程中，将电子设备中已经验证过的语音模板作为先验信息，以进一步判断接收到的唤醒语音是否能够将电子设备的语音功能唤醒，在接收到的唤醒语音能够将电子设备的语音功能唤醒的情况下，可以基于该接收到的唤醒语音进一步调整该自定义唤醒词的声纹阈值，以得到更为合适的声纹阈值；从而降低自定义唤醒词对应的语音唤醒失败的情况。语音唤醒失败的情况。语音唤醒失败的情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音唤醒方法、电子设备及芯片系统

[0001]本申请涉及语音控制
，尤其涉及一种语音唤醒方法、电子设备及芯片系统。

技术介绍

[0002]随着用户的需求增多，智能电子设备的功能越来越强大。例如，用户可以不通过电子设备上的按钮(或按键)、遥控器等控制电子设备，而是通过语音控制电子设备。当然，通过语音控制电子设备时，首先需要通过唤醒词唤醒电子设备的语音功能。
[0003]通常，电子设备在出厂时，生产厂家会为电子设备的语音助手设置初始唤醒词、打分策略以及声纹阈值等，用户也可以根据个人喜好自定义唤醒词。然而，用户自定义唤醒词的声纹阈值通常设置较为不合理，导致用户通过自定义唤醒词唤醒电子设备的语音功能时，常常出现唤醒失败的现象。

技术实现思路

[0004]本申请提供一种语音唤醒方法、电子设备及芯片系统，可以降低自定义唤醒词唤醒失败的现象。
[0005]为达到上述目的，本申请采用如下技术方案：
[0006]第一方面，本申请提供一种语音唤醒方法，包括：
[0007]在注册阶段，接收到第一语音，将第一语音生成第一唤醒词的第一模板，为第一唤醒词设置第一阈值，第一阈值用于在非注册阶段判断接收到的语音是否可以作为第一唤醒词对应的语音唤醒电子设备的语音功能；
[0008]在非注册阶段，接收到第二语音，计算第二语音和第一模板的第一声纹匹配分值；
[0009]若第一声纹匹配分值小于第一阈值，则计算第二语音和第一先验信息的第二声纹匹配分值，以及第一模板和第一先验信息的第三声...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，包括：在注册阶段，接收到第一语音，将所述第一语音生成第一唤醒词的第一模板，为所述第一唤醒词设置第一阈值，所述第一阈值用于在非注册阶段判断接收到的语音是否可以作为所述第一唤醒词对应的语音唤醒电子设备的语音功能；在非注册阶段，接收到第二语音，计算所述第二语音和所述第一模板的第一声纹匹配分值；若所述第一声纹匹配分值小于所述第一阈值，则计算所述第二语音和第一先验信息的第二声纹匹配分值，以及所述第一模板和所述第一先验信息的第三声纹匹配分值，所述第一先验信息包括所述电子设备中存储的至少一个模板，所述第一先验信息不包括所述第一模板；计算基于同一第一先验信息的所述第二声纹匹配分值和所述第三声纹匹配分值的第一差异值；若所述第一差异值小于差异阈值的比例大于预设比例，则所述第二语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能，将所述第二语音生成所述第一唤醒词的第二模板，更新所述第一唤醒词的第一阈值为所述第一声纹匹配分值。2.如权利要求1所述的方法，其特征在于，所述电子设备中设置有初始唤醒词，所述初始唤醒词设置有初始模板和初始阈值；所述第一阈值为所述电子设备中的每个唤醒词的阈值的均值和第一系数的乘积，所述第一系数大于1；或，所述第一阈值为所述初始唤醒词的初始阈值和所述第一系数的乘积；或，所述第一阈值为第一值，所述第一值大于所述初始阈值。3.如权利要求2所述的方法，其特征在于，在计算所述第二语音和所述第一模板的第一声纹匹配分值之前，所述方法还包括：将所述第二语音转换为第一文本信息；基于所述第一文本信息，确定所述第二语音为所述第一唤醒词对应的语音；或者，计算所述第二语音和所述初始模板的第一初始声纹匹配分值；确定所述第一初始声纹匹配分值小于所述初始阈值。4.如权利要求1所述的方法，其特征在于，在计算所述第二语音和所述第一模板的第一声纹匹配分值之后，所述方法还包括：若所述第一声纹匹配分值大于或等于所述第一阈值，则所述第二语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能。5.如权利要求1所述的方法，其特征在于，在计算基于同一第一先验信息的所述第二声纹匹配分值和所述第三声纹匹配分值的第一差异值之后，所述方法还包括：若所述第一差异值小于所述差异阈值的比例小于或等于所述预设比例，则所述第二语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能失败。6.如权利要求1所述的方法，其特征在于，若所述第一差异值小于差异阈值的比例大于预设比例，在将所述第二语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能之前，所述方法还包括：
确定所述第二语音的信噪比大于信噪比阈值。7.如权利要求1所述的方法，其特征在于，在将所述第二语音生成所述第一唤醒词的第二模板，更新所述第一唤醒词的第一阈值为所述第一声纹匹配分值之后，所述方法包括：在非注册阶段，接收第三语音，计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值，所述第一唤醒词的比对模板包括所述第一模板和/或所述第二模板；若所述第四声纹匹配分值小于所述第一阈值，则计算所述第三语音和第二先验信息的第五声纹匹配分值，以及所述第一唤醒词的比对模板和所述第二先验信息的第六声纹匹配分值，所述第二先验信息包括所述电子设备中存储的至少一个模板，所述第二先验信息不包括所述第一唤醒词的比对模板；计算基于同一第二先验信息的所述第五声纹匹配分值和所述第六声纹匹配分值的第二差异值；若所述第二差异值小于所述差异阈值的比例大于所述预设比例，则所述第三语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能，将所述第三语音生成所述第一唤醒词的第三模板，更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值；若所述第二差异值小于所述差异阈值的比例小于或等于所述预设比例，则所述第三语音作为所述第一唤醒词的语音唤醒所述电子设备的语音功能失败。8.如权利要求7所述的方法，其特征在于，所述第一唤醒词的比对模板包括所述第一模板和所述第二模板，所述第四声纹匹配分值为：所述第三语音和所述第一模板的声纹匹配分值以及所述第三语音信息和所述第二模板的声纹匹配分值的均值。9.如权利要求7所述的方法，其特征在于，在计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值之前，所述方法还包括：将所述第三语音转换为第二文本信息；基于所述第二文本信息，确定所述第三语音为所述第一唤醒词对应的语音。10.如权利要求7所述的方法，其特征在于，所述第一唤醒词的比对模板包括所述第一模板和所述第二模板；所述第二先验信息包括：所述电子设备的初始唤醒词的初始模板；所述第六声纹匹配分值包括与所述第一模板对应的第六一声纹匹配分值和与所述第二模板对应的第六二声纹匹配分值；所述计算基于同一第二先验信息的所述第五声纹匹配分值和所述第六声纹匹配分值的第二差异值包括：计算基于所述初始模板第五声纹匹配分值和第六一声纹匹配分值的第二一差异值；计算基于所述初始模板的第五声纹匹配分值和第六二声纹匹配分值的第二二差异值；所述第二差异值包括所述第二一差异值和所述第二二差异值。11.如权利要求7所述的方法，其特征在于，在计算所述第三语音和所述第一唤醒词的比对模板的第四声纹匹配分值之后，所述方法还包括：若所述第四声纹匹配分值大于或等于所述第一阈值，所述第三语音作为所述第一唤醒词的语音成功唤醒所述电子设备的语音功能。12.如权利要求7至11任一项所述的方法，其特征在于，在将所述第三语音生成所述第一唤醒词的第三模板，更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值之前，所述方法还包括：确定所述第一唤醒词的模板的数量小于数量阈值；
相应的，所述方法还包括：若确定所述第一唤醒词的模板的数量不小于所述数量阈值，则更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值，不再将所述第三语音生成所述第一唤醒词的第三模板。13.如权利要求12所述的方法，其特征在于，若更新所述第一唤醒词的第一阈值为所述第四声纹匹配分值，不再将所述第三语音生成所述第一唤醒词的第三模板之后，所述方法还包括：在非注册阶段，接收第四语音，计算所述第四语音和所述第一唤醒词的比对模板的第七声纹...

【专利技术属性】
技术研发人员：王耀光，夏日升，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人