一种低信噪比环境下的语音唤醒方法及装置制造方法及图纸

技术编号：38371360 阅读：11 留言：0更新日期：2023-08-05 17:35

本发明专利技术涉及语音技术领域，其公开了一种低信噪比环境下的语音唤醒方法及装置，提高低信噪比环境下的语音唤醒性能。本发明专利技术中的语音唤醒方法包括：S1、获取语音样本数据，利用对所述语音样本数据的仿真模拟获得训练数据集；S2、利用所述训练数据集对具有软阈值化处理功能的语音唤醒模型进行训练，获得训练完成的语音唤醒模型；S3、在应用场景下，以获取的待预测语音数据作为输入，利用训练完成的语音唤醒模型输出预测结果。本发明专利技术方案在对语音信号进行处理时加入了软阈值化处理，其能够对输入信号进行分解后再对分解后的信号进行多尺度的噪声过滤，从而提高在低信噪比环境下语音唤醒的性能。本发明专利技术适用于低信噪比环境下的语音设备唤醒。醒。醒。

全部详细技术资料下载

【技术实现步骤摘要】
一种低信噪比环境下的语音唤醒方法及装置

[0001]本专利技术涉及语音
，具体涉及一种低信噪比环境下的语音唤醒方法及装置。

技术介绍

[0002]语音唤醒技术已经被广泛用于我们的生活中，如智能语音助手、扫地机等等。以往的语音唤醒技术针对信噪比较高的语音环境(如居家、办公等)，在低信噪比环境(如商场)下，由于背景噪声较大，严重干扰了正常语音的识别，因此面临着唤醒性能大幅下降的问题。

技术实现思路

[0003]本专利技术所要解决的技术问题是：提出一种低信噪比环境下的语音唤醒方法及装置，提高低信噪比环境下的语音唤醒性能。
[0004]本专利技术解决上述技术问题采用的技术方案是：
[0005]一方面，本专利技术提供了一种低信噪比环境下的语音唤醒方法，包括以下步骤：
[0006]S1、获取语音样本数据，利用对所述语音样本数据的仿真模拟获得训练数据集；
[0007]S2、利用所述训练数据集对具有软阈值化处理功能的语音唤醒模型进行训练，获得训练完成的语音唤醒模型；
[0008]S3、在应用场景下，以获取的待预测语音数据作为输入，利用训练完成的语音唤醒模型输出预测结果。
[0009]进一步的，步骤S1中，所述语音样本数据包括目标唤醒语音、负样本语音、噪声语音和混响语音。
[0010]进一步的，步骤S1中，所述仿真模拟包括但不限于对目标唤醒语音及负样本语音加入随机混响，再加入随机信噪比的环境噪声，如
‑
5dB～10dB。
[0011...

【技术保护点】

【技术特征摘要】
1.一种低信噪比环境下的语音唤醒方法，其特征在于，包括以下步骤：S1、获取语音样本数据，利用对所述语音样本数据的仿真模拟获得训练数据集；S2、利用所述训练数据集对具有软阈值化处理功能的语音唤醒模型进行训练，获得训练完成的语音唤醒模型；S3、在应用场景下，以获取的待预测语音数据作为输入，利用训练完成的语音唤醒模型输出预测结果。2.如权利要求1所述的一种低信噪比环境下的语音唤醒方法，其特征在于，步骤S1中，所述语音样本数据包括目标唤醒语音、负样本语音、噪声语音和混响语音。3.如权利要求2所述的一种低信噪比环境下的语音唤醒方法，其特征在于，步骤S1中，所述仿真模拟包括：对目标唤醒语音及负样本语音加入随机混响，再加入随机信噪比的环境噪声。4.如权利要求1所述的一种低信噪比环境下的语音唤醒方法，其特征在于，步骤S2中，所述具有软阈值化处理功能的语音唤醒模型采用残差结构，其包括n个级联的特征处理块，所述n大于等于2；每一个特征处理块具有软阈值化处理层，用于对残差信号进行软阈值化处理。5.如权利要求4所述的一种低信噪比环境下的语音唤醒方法，其特征在于，所述特征处理块包括顺次相连的第一因果扩张卷积网络、第一批归一化层、第一Relu激活函数、第二因果扩张卷积网络、第二批归一化层以及软阈值处理层。6.如权利要求5所述的一种低信噪比环境下的语音唤醒方法，其特征在于，所述软阈值处理层包括采用全连接层、门控循环单元或前馈顺序记忆网络的网络结构对注意力权...

【专利技术属性】
技术研发人员：朱海，王昆，周琳岷，
申请(专利权)人：四川长虹电子控股集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人