语音唤醒方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40418342 阅读：22 留言：0更新日期：2024-02-20 22:36

本申请提供了一种语音唤醒方法、装置、电子设备及存储介质，方法包括：对接收的语音信息进行预处理以提取得到音频特征；将音频特征输入语音唤醒模型中进行计算；基于语音唤醒模型得到的每一帧音频特征的得分进行整句唤醒词检测并获得唤醒分数；基于语音唤醒模型得到的残差连接输出进行唤醒词中单个音节的识别，并获得语音信息的状态机跳转状态；根据唤醒分数和状态机跳转状态判断语音信息是否满足唤醒条件。本申请基于单神经网络模型进行二段式的唤醒词检测，满足唤醒率的同时抑制了明显的误唤醒。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，具体涉及一种语音唤醒方法、装置、电子设备及存储介质。

技术介绍

1、语音唤醒技术的应用领域广泛，例如机器人、手机、可穿戴设备、智能家居、车载设备等。较多的带有语音功能的设备基于语音唤醒技术建立用户和机器之间的语音交互。不同的产品预先设置不同的唤醒词，当用户需要唤醒设备时需要说出预先设定的唤醒词。

2、为更好地满足用户需求，设备的语音唤醒装置会持续监听特定的唤醒词。出于隐私考虑，语音唤醒装置通常需要离线工作在具有低占用空间和低功耗要求的设备上。另外误唤醒是用户难以容忍的。综上，具有一定的唤醒率且误唤醒率较低是语音唤醒最重要的指标。

技术实现思路

1、为了解决上述技术问题，本申请提供了一种语音唤醒方法、装置、电子设备及存储介质，以在满足唤醒率的同时抑制明显的误唤醒。

2、第一方面，提供了一种语音唤醒方法，包括：

3、对接收的语音信息进行预处理以提取得到音频特征；

4、将所述音频特征输入语音唤醒模型中进行计算；

5、...

【技术保护点】

1.一种语音唤醒方法，其中，包括：

2.根据权利要求1所述的方法，其中，对接收的语音信息进行预处理以提取得到音频特征包括：

3.根据权利要求1所述的方法，其中，所述语音唤醒模型包括多层子模型，至少一层子模型包括扩大因果卷积层、PixelCNN门控单元、跳跃连接和残差连接层。

4.根据权利要求3所述的方法，其中，基于所述语音唤醒模型得到的每一帧音频特征的得分进行整句唤醒词检测并获得唤醒分数包括：

5.根据权利要求3所述的方法，其中，基于所述语音唤醒模型得到的残差连接输出进行唤醒词中单个音节的识别并获得所述语音信息的状态机跳转状态包括：

...

【技术特征摘要】

1.一种语音唤醒方法，其中，包括：

2.根据权利要求1所述的方法，其中，对接收的语音信息进行预处理以提取得到音频特征包括：

3.根据权利要求1所述的方法，其中，所述语音唤醒模型包括多层子模型，至少一层子模型包括扩大因果卷积层、pixelcnn门控单元、跳跃连接和残差连接层。

4.根据权利要求3所述的方法，其中，基于所述语音唤醒模型得到的每一帧音频特征的得分进行整句唤醒词检测并获得唤醒分数包括：

6.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员：朱宸都，
申请(专利权)人：北京奕斯伟计算技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人