语音信号检测方法、计算机存储介质及相关设备技术

技术编号：23432524 阅读：17 留言：0更新日期：2020-02-25 13:29

本申请实施例公开了一种语音信号检测方法、计算机存储介质及相关设备，属于语音识别技术领域。其中，该方法包括：获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号；利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理，得到当前音频信号的后验概率，其中，后验概率包括：当前音频信号包含语音信号的后验概率，及当前音频信号不包含语音信号的后验概率；基于当前音频信号的后验概率和预设门限值，得到当前音频信号的检测结果，其中，检测结果用于表征当前音频信号中包含语音信号的概率。因此，本申请实施例可以提升检测结果的可靠性和有效性，改善音频信号的检测质量，有效降低语音识别系统的误触发率。

Voice signal detection method, computer storage medium and related equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音信号检测方法、计算机存储介质及相关设备
本申请涉及语音识别领域，具体而言，涉及一种语音信号检测方法、计算机存储介质及相关设备。
技术介绍
在语音交互的产品上，可以通过语音识别系统对采集到的语音信号进行识别分析，但是，在远场语音识别的应用场景中，接收端的语音信号较弱，环境中的强噪声会显著降低音频信号的检测质量，从而容易引起识别系统的误触发。在强噪声、弱信号环境中，目前可以采用基于接收信号统计特征的信号检测方法，该方法利用门限值作为判断依据，并且只能利用当前帧的数据来进行判断，导致检测结果的可靠性不高。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种语音信号检测方法、计算机存储介质及相关设备，以至少解决相关技术中利用门限值作为语音信号检测的判断依据，检测结果可靠性不高的技术问题。根据本申请实施例的第一方面，提供了一种语音信号检测方法，包括：获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号；利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理，得到当前音频信号的后验概率，其中，后验概率包括：当前音频信号包含语音信号的后验概率，及当前音频信号不包含语音信号的后验概率；基于当前音频信号的后验概率和预设门限值，得到当前音频信号的检测结果，其中，检测结果用于表征当前音频信号中包含语音信号的概率。可选地，利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理，得到当前音频信号的后验概率包括：对当前音频信号和多个历史音频信号进...

【技术保护点】
1.一种语音信号检测方法，其特征在于，包括：/n获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号；/n利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理，得到所述当前音频信号的后验概率，其中，所述后验概率包括：所述当前音频信号包含语音信号的后验概率，及所述当前音频信号不包含语音信号的后验概率；/n基于所述当前音频信号的后验概率和预设门限值，得到所述当前音频信号的检测结果，其中，所述检测结果用于表征所述当前音频信号中包含语音信号的概率。/n

【技术特征摘要】
1.一种语音信号检测方法，其特征在于，包括：
获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号；
利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理，得到所述当前音频信号的后验概率，其中，所述后验概率包括：所述当前音频信号包含语音信号的后验概率，及所述当前音频信号不包含语音信号的后验概率；
基于所述当前音频信号的后验概率和预设门限值，得到所述当前音频信号的检测结果，其中，所述检测结果用于表征所述当前音频信号中包含语音信号的概率。

2.根据权利要求1所述的方法，其特征在于，利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理，得到所述当前音频信号的后验概率包括：
对所述当前音频信号和所述多个历史音频信号进行建模，得到所述当前音频信号的概率分布，其中，所述概率分布包括：所述当前音频信号包含语音信号的概率分布，及所述当前音频信号不包含语音信号的概率分布；
利用贝叶斯滤波对所述当前音频信号的概率分布进行处理，得到所述当前音频信号的后验概率。

3.根据权利要求2所述的方法，其特征在于，对所述当前音频信号和所述多个历史音频信号进行建模，得到所述当前音频信号的概率分布包括：
对所述当前音频信号进行处理，得到当前噪声信号和当前语音信号；
获取所述当前噪声信号的平均功率和所述当前语音信号的平均功率；
基于所述当前噪声信号的平均功率、所述当前语音信号的平均功率、多个历史噪声信号的平均功率和多个历史语音信号的平均功率，得到所述当前音频信号包含语音信号的概率分布，其中，所述多个历史噪声信号和所述多个历史语音信号是对所述多个历史音频信号进行处理得到的；
基于所述当前噪声信号的平均功率和多个历史噪声信号的平均功率，得到所述当前音频信号不包含语音信号的概率分布。

4.根据权利要求3所述的方法，其特征在于，获取所述当前噪声信号的平均功率和所述当前语音信号的平均功率包括：
获取目标噪声信号的平均功率和目标语音信号的平均功率，其中，所述目标噪声信号和所述目标语音信号是对前一个时刻采集到的历史音频信号进行处理得到的；
基于所述目标噪声信号的平均功率和所述当前噪声信号，得到所述当前噪声信号的平均功率；
基于所述目标语音信号的平均功率和所述当前语音信号，得到所述当前语音信号的平均功率。

5.根据权利要求4所述的方法，其特征在于，通过如下公式得到所述当前噪声信号的平均功率和到所述当前噪声信号的平均功率：
δv(n)＝λδv(n-1)+(1-λ)|v(n)|2，
δs(n)＝λδs(n-1)+(1-λ)|s(n)|2，
其中，δv(n)表示所述当前噪声信号的平均功率，δv(n-1)表示所述目标噪声信号的平均功率，v(n)表示所述当前噪声信号，λ表示遗忘因子，δs(n)表示所述当前语音信号的平均功率，δs(n-1)表示所述目标语音信号的平均功率，s(n)表示所述当前语音信号。

6.根据权利要求3所述的方法，其特征在于，通过如下公式得到所述概率分布：

其中，N(g)表示高斯分布，H0表示所述当前音频信号不包含语音信号的概率分布，H1表示所述当前音频信号包含语音...

【专利技术属性】
技术研发人员：王亮亮，
申请(专利权)人：广州视源电子科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人