基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质制造方法及图纸

技术编号：34494756 阅读：22 留言：0更新日期：2022-08-10 09:14

本发明专利技术公开了基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质，包括：将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取语音数据的语音特征的概率分布；将概率分布输入神经网络模型进行快速校验；对快速校验的结果进行判断，若快速校验的结果为可信，则进行语音唤醒；若结果为不可信，则对语音数据进行持续时间和阈值的判断；若语音数据的持续时间和阈值达到了最低要求，则对语音数据进行对唤醒词的语音识别。本申请实施例通过提供基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质，解决了现有技术中语音识别准确性不足的问题，实现了语音识别的性能功耗与准确性的平衡。了语音识别的性能功耗与准确性的平衡。了语音识别的性能功耗与准确性的平衡。

全部详细技术资料下载

【技术实现步骤摘要】
基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及基于关键词识别技术的语音唤醒方法装置、设备以及可读存储介质。

技术介绍

[0002]关键词识别是语音识别的研究方向之一，已经在实践中取得了广泛的运用，特别是在嵌入式设备中，关键词唤醒的主要目的是让语音识别系统平时处于低功耗的唤醒监听状态，在监听到关键词时再开启语音识别功能，有效地节约了资源。
[0003]与将语言流转换成对应的字符串的语音识别不同，关键词唤醒是从语音流中探测特定的词汇，具有功耗低、响应迅速的特点。如误唤醒和唤不醒的现象。

技术实现思路

[0004]本申请实施例通过提供基于关键词识别技术的语音唤醒方法、装置、设备以及可读存储介质，解决了现有技术中语音识别准确性不足的问题，实现了语音唤醒的性能功耗与准确性的平衡。
[0005]第一方面，本申请实施例提供了基于关键词识别技术的语音唤醒方法，包括：
[0006]将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取所述语音数据的语音特征的概率分布；
[0007]将所述概率分布输入所述神经网络模型进行快速校验；
[0008]对所述快速校验的结果进行判断，若所述快速校验的结果为可信，则进行语音唤醒；
[0009]若所述结果为不可信，则对所述语音数据进行持续时间和阈值的判断；
[0010]若所述语音数据的持续时间和阈值达到了最低要求，则对所述语音数据进行对唤醒词的语音识别，若所述...

【技术保护点】

【技术特征摘要】
1.基于关键词识别技术的语音唤醒方法，其特征在于，包括：将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取所述语音数据的语音特征的概率分布；将所述概率分布输入所述神经网络模型进行快速校验；对所述快速校验的结果进行判断，若所述快速校验的结果为可信，则进行语音唤醒；若所述结果为不可信，则对所述语音数据进行持续时间和阈值的判断；若所述语音数据的持续时间和阈值达到了最低要求，则对所述语音数据进行对唤醒词的语音识别，若所述语音识别的结果为通过，则进行语音唤醒；若所述语音识别的结果为不通过，则不进行语音唤醒；若所述概率分布的持续时间和阈值没有达到最低要求，则不进行语音唤醒。2.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述预先训练神经网络模型，包括：建立神经网络模型；重复多次将语音数据输入所述神经网络模型进行快速校验的训练和判断所述语音数据的持续时间与阈值的训练。3.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，所述概率分布，包括：所述语音数据的首个音的概率、最后一个音的概率、单个音的持续时间以及整个词的概率。4.如权利要求1所述的基于关键词识别技术的语音唤醒方法，其特征在于，在所述将获取到的语音数据输入预先训练好的神经网络模型进行计算，以获取所述语音数据的语音特征的概率分布的步骤之后，还包括：若所述神经网络模型输出的所述概率分布不为音或字的概率，则对所述概率分布进行预处理。5.如权利要求4所述的基...

【专利技术属性】
技术研发人员：赵茂祥，李全忠，何国涛，蒲瑶，
申请(专利权)人：普强时代珠海横琴信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人