语音检测方法、装置、设备和存储介质制造方法及图纸

技术编号:27831955 阅读:40 留言:0更新日期:2021-03-30 11:40
本申请实施例提供一种语音检测方法、装置、设备和存储介质,该方法包括:获取待检测信号的能量;若所述待检测信号的能量大于或等于第一阈值,则将所述待检测信号的频域进行分段,得到至少一个第一子频带;根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果;所述检测结果用于指示所述待检测信号是否为语音信号。本申请实施例的方法实现了低功耗的语音检测,而且语音检测的准确度较高。高。高。

【技术实现步骤摘要】
语音检测方法、装置、设备和存储介质


[0001]本申请实施例涉及语音检测
,尤其涉及一种语音检测方法、装置、设备和存储介质。

技术介绍

[0002]随着语音唤醒、语音识别等技术越来越广泛地被应用到生活中,语音检测作为其必要的前端处理而被重视。语音检测的作用是检测出当前环境中是否有语音存在,且定位出语音的起始及结束位置,从而将语音片段从噪声中分离出来并送到后端做语音识别及唤醒等处理。语音检测的准确度将直接影响后续工作的正确率。
[0003]语音检测模块需要处于一直工作的状态,才能实现实时监测语音活动的目的,所以语音检测设计对功耗要求相对较高。但是相关技术中,一般通过设定语音信号的能量阈值来检测是否存在语音信号,如果采用低阈值检测,会引起噪声被误检为语音的概率提升,导致频繁启动识别等后续处理操作,带来功耗损失;如果采用高阈值检测,则可能发生漏检,语音检测的准确性较低。因此,对于本领域技术人员来说,如何实现一种既能保证语音检测的准确性又不带来较大功耗的语音检测方法,是亟需解决的技术问题。

技术实现思路

[0004]本申请提供一种语音检测方法、装置、设备和存储介质,以实现低功耗的语音检测,而且语音检测的准确度较高。
[0005]第一方面,本申请提供一种语音检测方法,包括:
[0006]获取待检测信号的能量;
[0007]若所述待检测信号的能量大于或等于第一阈值,则将所述待检测信号的频域进行分段,得到至少一个第一子频带;
[0008]根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果;所述检测结果用于指示所述待检测信号是否为语音信号。
[0009]在一种可能的实现方式中,所述根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果,包括:
[0010]若存在至少一个第二子频带,或所述待检测信号在总频带上的语音存在概率大于或等于第二阈值,则确定所述待检测信号为语音信号;所述第二子频带为所述至少一个第一子频带中语音存在概率大于或等于各自对应的第三阈值的子频带;
[0011]若所述待检测信号在所述至少一个第一子频带的语音存在概率均小于各自对应的第三阈值,且所述待检测信号在总频带上的语音存在概率小于所述第二阈值,则确定所述待检测信号不为语音信号。
[0012]在一种可能的实现方式中,所述确定所述待检测信号为语音信号之后,还包括:
[0013]若连续的语音信号的帧数达到预设帧数,则对所述至少一个第一子频道各自对应的第三阈值和所述第二阈值进行调整。
[0014]在一种可能的实现方式中,所述对所述至少一个第一子频道各自对应的第三阈值和所述第二阈值进行调整,包括:
[0015]降低所述至少一个第一子频道各自对应的第三阈值,以及所述第二阈值。
[0016]在一种可能的实现方式中,还包括:
[0017]若所述待检测信号的能量小于所述第一阈值,则对所述第一阈值进行更新。
[0018]在一种可能的实现方式中,所述对所述第一阈值进行更新,包括:
[0019]获取预设时长内的噪声信号;
[0020]根据所述预设时长内的噪声信号的能量平均值,对所述第一阈值进行更新。
[0021]在一种可能的实现方式中,所述对所述第一阈值进行更新,包括:
[0022]将所述预设时长内的噪声信号的能量平均值乘以预设值,作为更新后的第一阈值。
[0023]在一种可能的实现方式中,所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果之前,还包括:
[0024]对于任一第一子频带来说,根据所述第一子频道带的信号,利用预设模型获取所述第一子频带上的语音特征和噪声特征;
[0025]根据所述第一子频带上的语音特征和噪声特征,利用所述预设模型计算所述第一子频带对应的语音存在概率。
[0026]第二方面,本申请提供一种语音检测装置,包括:
[0027]获取模块,用于获取待检测信号的能量;
[0028]处理模块,用于若所述待检测信号的能量大于或等于第一阈值,则将所述待检测信号的频域进行分段,得到至少一个第一子频带;
[0029]所述处理模块,还用于根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果;所述检测结果用于指示所述待检测信号是否为语音信号。
[0030]在一种可能的实现方式中,所述处理模块具体用于:
[0031]若存在至少一个第二子频带,或所述待检测信号在总频带上的语音存在概率大于或等于第二阈值,则确定所述待检测信号为语音信号;所述第二子频带为所述至少一个第一子频带中语音存在概率大于或等于各自对应的第三阈值的子频带;
[0032]若所述待检测信号在所述至少一个第一子频带的语音存在概率均小于各自对应的第三阈值,且所述待检测信号在总频带上的语音存在概率小于所述第二阈值,则确定所述待检测信号不为语音信号。
[0033]在一种可能的实现方式中,所述处理模块还用于:
[0034]若连续的语音信号的帧数达到预设帧数,则对所述至少一个第一子频道各自对应的第三阈值和所述第二阈值进行调整。
[0035]在一种可能的实现方式中,所述处理模块具体用于:
[0036]降低所述至少一个第一子频道各自对应的第三阈值,以及所述第二阈值。
[0037]在一种可能的实现方式中,所述处理模块还用于:
[0038]若所述待检测信号的能量小于所述第一阈值,则对所述第一阈值进行更新。
[0039]在一种可能的实现方式中,所述处理模块具体用于:
[0040]获取预设时长内的噪声信号;
[0041]根据所述预设时长内的噪声信号的能量平均值,对所述第一阈值进行更新。
[0042]在一种可能的实现方式中,所述处理模块具体用于:
[0043]将所述预设时长内的噪声信号的能量平均值乘以预设值,作为更新后的第一阈值。
[0044]在一种可能的实现方式中,所述处理模块具体用于:
[0045]对于任一第一子频带来说,根据所述第一子频道带的信号,利用预设模型获取所述第一子频带上的语音特征和噪声特征;
[0046]根据所述第一子频带上的语音特征和噪声特征,利用所述预设模型计算所述第一子频带对应的语音存在概率。
[0047]第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法。
[0048]第四方面,本申请实施例提供一种电子设备,包括:
[0049]处理器;以及
[0050]存储器,用于存储所述处理器的可执行指令;
[0051]其中,所述处理器配置为经由执行所述可执行指令来执行第一方面中任一项所述的方法。
[0052]第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面中任一项所述的方法。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音检测方法,其特征在于,包括:获取待检测信号的能量;若所述待检测信号的能量大于或等于第一阈值,则将所述待检测信号的频域进行分段,得到至少一个第一子频带;根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果;所述检测结果用于指示所述待检测信号是否为语音信号。2.根据权利要求1所述的方法,其特征在于,所述根据所述待检测信号在每个第一子频带上的语音存在概率,确定检测结果,包括:若存在至少一个第二子频带,或所述待检测信号在总频带上的语音存在概率大于或等于第二阈值,则确定所述待检测信号为语音信号;所述第二子频带为所述至少一个第一子频带中语音存在概率大于或等于各自对应的第三阈值的子频带;若所述待检测信号在所述至少一个第一子频带的语音存在概率均小于各自对应的第三阈值,且所述待检测信号在总频带上的语音存在概率小于所述第二阈值,则确定所述待检测信号不为语音信号。3.根据权利要求2所述的方法,其特征在于,所述确定所述待检测信号为语音信号之后,还包括:若连续的语音信号的帧数达到预设帧数,则对所述至少一个第一子频道各自对应的第三阈值和所述第二阈值进行调整。4.根据权利要求3所述的方法,其特征在于,所述对所述至少一个第一子频道各自对应的第三阈值和所述第二阈值进行调整,包括:降低所述至少一个第一子频道各自对应的第三阈值,以及所述第二阈值。5.根据权利要求1

4任一项所述的方法,其特征在于,还包括:若所述待检测信号的能量小于所述第一阈值,则对所...

【专利技术属性】
技术研发人员:方思敏夏洁李开罗丽云
申请(专利权)人:锐迪科微电子上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1