语音唤醒方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号：35522864 阅读：29 留言：0更新日期：2022-11-09 14:43

本公开提供了一种语音唤醒方法、装置、电子设备和计算机可读存储介质，涉及语音处理技术领域。所述方法包括：根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到待识别语音的声纹特征向量和唤醒词；根据预设的对应关系表，查询与唤醒词对应的注册唤醒词标签，并根据注册唤醒词标签，得到注册特征向量；根据声纹特征向量和注册特征向量，计算向量相似度；在向量相似度大于预设的阈值的情况下，进行语音唤醒。利用一个神经网络模型同时实现声纹识别和语音唤醒词匹配这两个任务，解决了两个任务分别构建模型导致的参数冗余、占用内存过大的问题，本公开流程更加简洁，唤醒速度更快。更快。更快。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法、装置、电子设备和计算机可读存储介质

[0001]本公开涉及语音处理
，尤其涉及一种语音唤醒方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]语音唤醒是指用户通过说出唤醒词来唤醒电子设备，使电子设备进入等待语音指令或执行语音指令的状态。
[0003]相关技术中，对输入的语音进行固定唤醒词匹配的模型训练及测试，同时对输入的语音进行声纹识别进行模型训练及认证，根据这两种模型测试结果逻辑上取交集，输出是否唤醒的结果。通过唤醒词匹配和声纹识别这两种子任务各自进行训练模型的方法，导致模型参数冗余、占用内存过大、唤醒速度慢。
[0004]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种语音唤醒方法、装置、电子设备和计算机可读存储介质，至少在一定程度上克服模型参数冗余、占用内存过大、唤醒速度慢的问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。
[0007]根据本公开的一个方面，提供一种语音唤醒方法，所述方法包括：
[0008]根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词；
[0009]根据预设的对应关系表，查询与所述唤醒词对应的注册唤醒词标签，并根据所述注册唤醒词标签，得到注册特征向量；
[00...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，包括：根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词；根据预设的对应关系表，查询与所述唤醒词对应的注册唤醒词标签，并根据所述注册唤醒词标签，得到注册特征向量；根据所述声纹特征向量和所述注册特征向量，计算向量相似度；在所述向量相似度大于预设的阈值的情况下，进行语音唤醒。2.根据权利要求1所述的语音唤醒方法，其特征在于，在根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词之前，所述方法还包括：获取注册语音的语谱图；根据预先训练的神经网络模型对所述注册语音的语谱图进行处理，得到注册特征向量和注册唤醒词标签；根据所述注册特征向量和所述注册唤醒词标签构建所述对应关系表。3.根据权利要求1所述的语音唤醒方法，其特征在于，在根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词之前，所述方法还包括：去除待识别语音中的静默音，得到有效待识别语音；当所述有效待识别语音的有效音频时长大于或等于预设的时长阈值时，对所述有效待识别语音进行处理，得到所述待识别语音的语谱图。4.根据权利要求3所述的语音唤醒方法，其特征在于，所述方法还包括：当所述有效待识别语音的有效音频时长小于预设的时长阈值时，语音唤醒失败。5.根据权利要求1所述的语音唤醒方法，其特征在于，所述根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词之前，所述方法还包括：将待识别语音分割成多个时长为第一时长的语音文件，所述语音文件的帧长为第二时长、帧移为第三时长；将所述语音文件转化为语谱图。6.根据权利要求2所述的语音唤醒方法，其特征在于，在根据预先训练的神经网络模型对待识别语音的语谱图进行处理，得到所述待识别语音的声纹特征向量和唤醒词之前，所述方法还包括：对获取到的语音数据集进行处理，得到所述语音数据集的语谱图；根据所述语音数据集的语谱图和对应的标签，训练初始神经网络模型，其中，所述初始神经网络模型包括第一目标网络结构和第二目标网络结构，若满足预设的第一训练停止条件，则将所述初始神经网络模型作为目标神经网络模型。7.根据权利要求6所述的语音唤醒方法，其特征在于，所述语音数据集的语谱图包括用于...

【专利技术属性】
技术研发人员：成莎莎，赵德欣，沈浩，杨杰，李晓宇，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人