语音信号检测方法、计算机存储介质及相关设备技术

技术编号:23432524 阅读:17 留言:0更新日期:2020-02-25 13:29
本申请实施例公开了一种语音信号检测方法、计算机存储介质及相关设备,属于语音识别技术领域。其中,该方法包括:获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号;利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理,得到当前音频信号的后验概率,其中,后验概率包括:当前音频信号包含语音信号的后验概率,及当前音频信号不包含语音信号的后验概率;基于当前音频信号的后验概率和预设门限值,得到当前音频信号的检测结果,其中,检测结果用于表征当前音频信号中包含语音信号的概率。因此,本申请实施例可以提升检测结果的可靠性和有效性,改善音频信号的检测质量,有效降低语音识别系统的误触发率。

Voice signal detection method, computer storage medium and related equipment

【技术实现步骤摘要】
语音信号检测方法、计算机存储介质及相关设备
本申请涉及语音识别领域,具体而言,涉及一种语音信号检测方法、计算机存储介质及相关设备。
技术介绍
在语音交互的产品上,可以通过语音识别系统对采集到的语音信号进行识别分析,但是,在远场语音识别的应用场景中,接收端的语音信号较弱,环境中的强噪声会显著降低音频信号的检测质量,从而容易引起识别系统的误触发。在强噪声、弱信号环境中,目前可以采用基于接收信号统计特征的信号检测方法,该方法利用门限值作为判断依据,并且只能利用当前帧的数据来进行判断,导致检测结果的可靠性不高。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种语音信号检测方法、计算机存储介质及相关设备,以至少解决相关技术中利用门限值作为语音信号检测的判断依据,检测结果可靠性不高的技术问题。根据本申请实施例的第一方面,提供了一种语音信号检测方法,包括:获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号;利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理,得到当前音频信号的后验概率,其中,后验概率包括:当前音频信号包含语音信号的后验概率,及当前音频信号不包含语音信号的后验概率;基于当前音频信号的后验概率和预设门限值,得到当前音频信号的检测结果,其中,检测结果用于表征当前音频信号中包含语音信号的概率。可选地,利用贝叶斯滤波对当前音频信号和多个历史音频信号进行处理,得到当前音频信号的后验概率包括:对当前音频信号和多个历史音频信号进行建模,得到当前音频信号的概率分布,其中,概率分布包括:当前音频信号包含语音信号的概率分布,及当前音频信号不包含语音信号的概率分布;利用贝叶斯滤波对当前音频信号的概率分布进行处理,得到当前音频信号的后验概率。可选地,对当前音频信号和多个历史音频信号进行建模,得到当前音频信号的概率分布包括:对当前音频信号进行处理,得到当前噪声信号和当前语音信号;获取当前噪声信号的平均功率和当前语音信号的平均功率;基于当前噪声信号的平均功率、当前语音信号的平均功率、多个历史噪声信号的平均功率和多个历史语音信号的平均功率,得到当前音频信号包含语音信号的概率分布,其中,多个历史噪声信号和多个历史语音信号是对多个历史音频信号进行处理得到的;基于当前噪声信号的平均功率和多个历史噪声信号的平均功率,得到当前音频信号不包含语音信号的概率分布。可选地,获取当前噪声信号的平均功率和当前语音信号的平均功率包括:获取目标噪声信号的平均功率和目标语音信号的平均功率,其中,目标噪声信号和目标语音信号是对前一个时刻采集到的历史音频信号进行处理得到的;基于目标噪声信号的平均功率和当前噪声信号,得到当前噪声信号的平均功率;基于目标语音信号的平均功率和当前语音信号,得到当前语音信号的平均功率。可选地,通过如下公式得到当前噪声信号的平均功率和到当前噪声信号的平均功率:δv(n)=λδv(n-1)+(1-λ)|v(n)|2,δs(n)=λδs(n-1)+(1-λ)|s(n)|2,其中,δv(n)表示当前噪声信号的平均功率,δv(n-1)表示目标噪声信号的平均功率,v(n)表示当前噪声信号,λ表示遗忘因子,δs(n)表示当前语音信号的平均功率,δs(n-1)表示目标语音信号的平均功率,s(n)表示当前语音信号。可选地,通过如下公式得到概率分布:其中,N(g)表示高斯分布,H0表示当前音频信号不包含语音信号的概率分布,H1表示当前音频信号包含语音信号的概率分布。可选地,利用贝叶斯滤波对当前音频信号的概率分布进行处理,得到当前音频信号的后验概率包括:获取多个历史音频信号的概率分布,以及前一个时刻采集到的目标音频信号的后验概率;利用贝叶斯滤波对当前音频信号的概率分布,多个历史音频信号的概率分布,以及目标音频信号的后验概率进行处理,得到当前音频信号的后验概率。可选地,通过如下公式得到当前音频信号包含语音信号的后验概率:其中,P(H1|Z(n-N+1),...,Z(n))表示当前音频信号包含语音信号的后验概率,P(H1|Z(n-N+1),...,Z(n-1))表示目标音频信号的后验概率,Z(n-N+1),...,Z(n-1)表示多个历史音频信号的概率分布;0时刻采集到的音频信号包含语音信号的后验概率P(H1|Z(0))的公式如下:其中,P(H1)表示0时刻采集到的音频信号包含语音信号的概率,P(H0)表示0时刻采集到的音频信号不包含语音信号的概率。可选地,基于当前音频信号的后验概率和预设门限值,得到当前音频信号的检测结果包括:将当前音频信号的概率分布与预设门限值进行比较;基于当前音频信号的后验概率和比较结果,得到检测结果。可选地,基于当前音频信号的后验概率和比较结果,得到检测结果包括:在当前音频信号的概率分布大于预设门限值的情况下,基于当前音频信号包含语音信号的后验概率,及当前音频信号不包含语音信号的后验概率,得到检测结果;在当前音频信号的概率分布小于预设门限值的情况下,基于当前音频信号包含语音信号的后验概率,得到检测结果。可选地,基于当前音频信号包含语音信号的后验概率,及当前音频信号不包含语音信号的后验概率,得到检测结果包括:获取状态转移概率与当前音频信号不包含语音信号的后验概率的乘积,得到第一乘积;获取第一乘积与当前音频信号包含语音信号的后验概率之和,得到检测结果。可选地,基于当前音频信号包含语音信号的后验概率,得到检测结果包括:获取状态转移概率与当前音频信号包含语音信号的后验概率的乘积,得到第二乘积;获取当前音频信号包含语音信号的后验概率与第二乘积之差,得到检测结果。根据本申请实施例的第二方面,提供了一种语音信号检测方法,包括:获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号;对当前音频信号和多个历史音频信号进行建模,得到当前音频信号的概率分布,其中,概率分布包括:当前音频信号包含语音信号的概率分布,及当前音频信号不包含语音信号的概率分布;利用贝叶斯滤波对当前音频信号的概率分布进行处理,得到当前音频信号的后验概率,其中,后验概率包括:当前音频信号包含语音信号的后验概率,及当前音频信号不包含语音信号的后验概率;将当前音频信号的概率分布与预设门限值进行比较;基于当前音频信号的后验概率和比较结果,得到当前音频信号的检测结果,其中,检测结果用于表征当前音频信号中包含语音信号的概率。可选地,对当前音频信号和多个历史音频信号进行建模,得到当前音频信号的概率分布包括:对当前音频信号进行处理,得到当前噪声信号和当前语音信号;获取当前噪声信号的平均功率和当前语音信号的平均功率;基于当前噪声信号的平均功率、当前语音信号的平均功率、多个历史噪声信号的平均功率和多个历史语音信号的平均功率,得到当前音频信号包含语音信号的概率分布,其中,多个历史噪声信号和多个历史语音信号是对多个历史音频信号进行处理得到的;基于当前噪声信号的平均功率和多个历史噪声信号的平均功率,得到当前音频信号不包含语音信号的概率分布。<本文档来自技高网...

【技术保护点】
1.一种语音信号检测方法,其特征在于,包括:/n获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号;/n利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理,得到所述当前音频信号的后验概率,其中,所述后验概率包括:所述当前音频信号包含语音信号的后验概率,及所述当前音频信号不包含语音信号的后验概率;/n基于所述当前音频信号的后验概率和预设门限值,得到所述当前音频信号的检测结果,其中,所述检测结果用于表征所述当前音频信号中包含语音信号的概率。/n

【技术特征摘要】
1.一种语音信号检测方法,其特征在于,包括:
获取当前时刻采集到的当前音频信号和历史时刻采集到的多个历史音频信号;
利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理,得到所述当前音频信号的后验概率,其中,所述后验概率包括:所述当前音频信号包含语音信号的后验概率,及所述当前音频信号不包含语音信号的后验概率;
基于所述当前音频信号的后验概率和预设门限值,得到所述当前音频信号的检测结果,其中,所述检测结果用于表征所述当前音频信号中包含语音信号的概率。


2.根据权利要求1所述的方法,其特征在于,利用贝叶斯滤波对所述当前音频信号和所述多个历史音频信号进行处理,得到所述当前音频信号的后验概率包括:
对所述当前音频信号和所述多个历史音频信号进行建模,得到所述当前音频信号的概率分布,其中,所述概率分布包括:所述当前音频信号包含语音信号的概率分布,及所述当前音频信号不包含语音信号的概率分布;
利用贝叶斯滤波对所述当前音频信号的概率分布进行处理,得到所述当前音频信号的后验概率。


3.根据权利要求2所述的方法,其特征在于,对所述当前音频信号和所述多个历史音频信号进行建模,得到所述当前音频信号的概率分布包括:
对所述当前音频信号进行处理,得到当前噪声信号和当前语音信号;
获取所述当前噪声信号的平均功率和所述当前语音信号的平均功率;
基于所述当前噪声信号的平均功率、所述当前语音信号的平均功率、多个历史噪声信号的平均功率和多个历史语音信号的平均功率,得到所述当前音频信号包含语音信号的概率分布,其中,所述多个历史噪声信号和所述多个历史语音信号是对所述多个历史音频信号进行处理得到的;
基于所述当前噪声信号的平均功率和多个历史噪声信号的平均功率,得到所述当前音频信号不包含语音信号的概率分布。


4.根据权利要求3所述的方法,其特征在于,获取所述当前噪声信号的平均功率和所述当前语音信号的平均功率包括:
获取目标噪声信号的平均功率和目标语音信号的平均功率,其中,所述目标噪声信号和所述目标语音信号是对前一个时刻采集到的历史音频信号进行处理得到的;
基于所述目标噪声信号的平均功率和所述当前噪声信号,得到所述当前噪声信号的平均功率;
基于所述目标语音信号的平均功率和所述当前语音信号,得到所述当前语音信号的平均功率。


5.根据权利要求4所述的方法,其特征在于,通过如下公式得到所述当前噪声信号的平均功率和到所述当前噪声信号的平均功率:
δv(n)=λδv(n-1)+(1-λ)|v(n)|2,
δs(n)=λδs(n-1)+(1-λ)|s(n)|2,
其中,δv(n)表示所述当前噪声信号的平均功率,δv(n-1)表示所述目标噪声信号的平均功率,v(n)表示所述当前噪声信号,λ表示遗忘因子,δs(n)表示所述当前语音信号的平均功率,δs(n-1)表示所述目标语音信号的平均功率,s(n)表示所述当前语音信号。


6.根据权利要求3所述的方法,其特征在于,通过如下公式得到所述概率分布:



其中,N(g)表示高斯分布,H0表示所述当前音频信号不包含语音信号的概率分布,H1表示所述当前音频信号包含语音...

【专利技术属性】
技术研发人员:王亮亮
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1