一种有效语音信号的检测方法、装置及设备制造方法及图纸

技术编号:23402038 阅读:15 留言:0更新日期:2020-02-22 14:06
本申请涉及音频技术领域,提供了一种有效语音信号的检测方法,该方法包括:获取预设时长的第一音频信号,所述第一音频信号包括至少一个音频帧信号,针对所述每个音频帧信号进行小波分解,按照所述音频帧信号在所述第一音频信号中的分帧顺序,将各个音频帧信号对应的小波分解信号进行拼接得到小波信号序列;根据所述小波信号序列中所有样点的音频强度值的最大值和最小值确定第一音频强度阈值;将所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应样点的信号确定为有效语音信号。实施本实施例,通过采集小波信号序列中所有样点的能量信息,对有效语音信号进行判断检测,提高有效语音检测的准确性。

An effective voice signal detection method, device and equipment

【技术实现步骤摘要】
一种有效语音信号的检测方法、装置及设备
本申请涉及音频
,尤其是一种有效语音信号的检测方法、装置及设备。
技术介绍
语音作为一种人机交互的手段,但噪声干扰时时刻刻存在工作环境中,这些噪声会影响语音的应用效果,所以需要对有效语音信号进行检测,将有效语音信号与噪声干扰信号进行区分,以便进一步的处理。语音信号和噪声信号的区别可以体现在各自的能量上,在高信噪比的情况下,信噪比可以理解为语音信号与噪声信号的比值,语音信号部分的能量一般要比噪声信号部分的能量大得多。但是,在低信噪比的情况下,输入的音频段频繁出现噪声时,噪声信号的能量较大,与语音信号的能量相差无几,在现有技术中,采用基于信号能量的方法对语音信号进行检测的方法,根据输入信号的短时能量将语音信号和噪声信号进行区分,计算一段时间内输入信号的能量,通过与相邻一段时间内输入信号的能量进行对比,判断当前时间内的信号为语音信号还是噪声信号。采用现有技术的方案,通过对一段时间内信号的能量进行计算与对比,由于噪声的频繁出现,在当前时间内的信号中存在噪声,在相邻时间段内的信号中也存在噪声,当前时间段的能量为噪声信号和语音信号的能量之和,而相邻时间段的能量也为噪声信号和语音信号的能量之和,从而无法对比出噪声的存在。噪声的频繁出现,使得信号的能量增加,干扰对信号的检测,会出现将噪声误检为有效语音信号的情况,所以现有技术对有效语音信号的检测的准确性不够高。
技术实现思路
基于上面所述的问题,本申请提供了一种有效语音信号的检测方法、装置及设备,通过采集小波信号序列中所有样点的能量信息,对有效语音信号进行判断检测,提高有效语音信号检测的准确性。第一方面,本申请提供了一种有效语音信号的检测方法,所述方法包括:获取预设时长的第一音频信号,所述第一音频信号包括至少一个音频帧信号;针对所述每个音频帧信号进行小波分解,得到分别与每个音频帧信号对应的多个小波分解信号,每个小波分解信号中包含多个样点以及每个样点的音频强度值;按照所述音频帧信号在所述第一音频信号中的分帧顺序,将各个音频帧信号对应的小波分解信号进行拼接得到小波信号序列;获取所述小波信号序列中所有样点的音频强度值中的最大值和最小值,根据所述小波信号序列中所有样点的音频强度值的最大值和最小值确定第一音频强度阈值;获取所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点,将所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应样点的信号确定为有效语音信号。在一种可能的实施例中,所述根据所述小波信号序列中所有样点音频强度值的最大值和最小值确定第一音频强度阈值包括:根据所述小波信号序列中所有样点的音频强度值中的最大值和最小值确定所述第一音频强度阈值和第二音频强度阈值,其中所述第一音频强度阈值小于所述第二音频强度阈值;所述将音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应的样点信号确定为有效语音信号包括:获取所述小波信号序列中第一样点,其中所述第一样点的前一样点的音频强度值小于所述第二音频强度阈值,以及所述第一样点的音频强度值大于所述第二音频强度阈值;获取所述小波信号序列中的第二样点,所述第二样点为在所述小波信号序列中排序在所述第一样点之后,首个出现音频强度值小于所述第一音频强度阈值的样点;确定所述小波信号序列中的所述第一样点和所述第二样点的前一样点在所述第一音频信号中对应样点的信号为所述有效语音信号中的有效语音段。可选的,所述第二样点与所述第一样点之间至少包括第一预设数量个连续样点。在一种可能的实施例中,所述方法还包括:将所述小波信号序列中包括目标样点在内的第二预设数量个连续样点的第一参考音频强度值的平均值作为所述目标样点的音频强度值。在一种可能的实施例中,所述将所述小波信号序列中包括目标样点在内的第二预设数量个连续样点的第一参考音频强度值的平均值作为所述目标样点的音频强度值之前包括:将所述小波信号序列中所述目标样点前一样点的音频强度值乘以平滑系数,得到所述目标样点的第二参考音频强度;将所述小波信号序列中包括所述目标样点在内,且在所述小波信号序列中排序顺序在所述目标样点之前的所有连续样点的音频强度值的平均值乘以剩余的平滑系数,得到所述目标样点的第三参考音频强度值;将所述第二参考音频强度值和所述第三参考音频强度值相加得到的数值,作为所述目标样点的第四参考音频强度值,将包括所述目标样点在内,且在所述小波信号序列中排序顺序在所述目标样点之前的所有样点的第四参考音频强度值中的最小值,作为所述目标样点的第一参考音频强度值。在一种可能的实现方式中,所述获取所述小波信号序列中所有样点的音频强度值中的最大值和最小值包括:获取所述小波信号序列中的第一小波分解信号所有样点音频强度值中的第一参考最大值和第一参考最小值;将所述小波信号序列中的所有小波分解信号中的参考最大值和参考最小值进行处理得到的数值,作为所述小波信号序列中所有样点音频强度值的最大值和最小值。可选的,所述获取预设时长的第一音频信号之前包括:将所述预设时长的原始音频信号中的第一预设阈值的高频成分进行补偿,从而得到所述第一音频信号。在一种可能的实施例中,所述针对所述每个音频帧信号进行小波分解包括:针对所述每个音频帧信号进行小波包分解,将小波包分解后得到的信号作为所述小波分解信号。在一种可能的实现方式中,所述根据所述小波信号序列中所有样点音频强度值的最大值和所述最小值确定第一参考音频强度阈值TL=min(λ1×(Scmax-Scmin)+Scmin,λ2×Scmin),其中Scmax和Scmin分别为所述小波信号序列中所有样点音频强度值的最大值和最小值,λ1为第二预设阈值,λ2为第三预设阈值。在一种可能的实现方式中,所述根据所述小波信号序列中所有样点的音频强度值中的最大值和最小值确定所述第一音频强度阈值和第二音频强度阈值包括:根据所述小波信号序列中所有样点的音频强度值中的最大值和最小值确定所述第一参考音频强度阈值TL=min(λ1.(Scmax-Scmin)+Scmin,λ2.Scmin),其中Scmax和Scmin分别为所述小波信号序列中所有样点音频强度值的最大值和最小值,λ1为第二预设阈值,λ2为第三预设阈值;所述第二音频强度阈值TU=αTL,其中α为第四预设阈值,α取值大于1。第二方面,本申请提供了一种语音信号检测的装置,包括:获取模块,用于获取预设时长的第一音频信号,所述第一音频信号包括至少一个音频帧信息;分解模块,用于针对所述每个音频帧信号进行小波分解,得到分别与每个音频帧信号对应的多个小波分解信号,每个小波分解中包含多个样点以及每个样点的音频强度值;拼接模块,用于按照所述音频帧信号在所述第一音频信号中的分帧顺序,将各个音频帧信号对应的小波分解信号进行拼接得到小波信号序列;确定模块,用于获本文档来自技高网...

【技术保护点】
1.一种有效语音信号的检测方法,其特征在于,所述方法包括:/n获取预设时长的第一音频信号,所述第一音频信号包括至少一个音频帧信号;/n针对所述每个音频帧信号进行小波分解,得到分别与每个音频帧信号对应的多个小波分解信号,每个小波分解信号中包含多个样点以及每个样点的音频强度值;/n按照所述音频帧信号在所述第一音频信号中的分帧顺序,将各个音频帧信号对应的小波分解信号进行拼接得到小波信号序列;获取所述小波信号序列中所有样点的音频强度值中的最大值和最小值,根据所述小波信号序列中所有样点的音频强度值的最大值和最小值确定第一音频强度阈值;/n获取所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点,将所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应样点的信号确定为有效语音信号。/n

【技术特征摘要】
1.一种有效语音信号的检测方法,其特征在于,所述方法包括:
获取预设时长的第一音频信号,所述第一音频信号包括至少一个音频帧信号;
针对所述每个音频帧信号进行小波分解,得到分别与每个音频帧信号对应的多个小波分解信号,每个小波分解信号中包含多个样点以及每个样点的音频强度值;
按照所述音频帧信号在所述第一音频信号中的分帧顺序,将各个音频帧信号对应的小波分解信号进行拼接得到小波信号序列;获取所述小波信号序列中所有样点的音频强度值中的最大值和最小值,根据所述小波信号序列中所有样点的音频强度值的最大值和最小值确定第一音频强度阈值;
获取所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点,将所述小波信号序列中音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应样点的信号确定为有效语音信号。


2.根据权利要求1所述的方法,其特征在于,所述根据所述小波信号序列中所有样点音频强度值的最大值和最小值确定第一音频强度阈值包括:
根据所述小波信号序列中所有样点的音频强度值中的最大值和最小值确定所述第一音频强度阈值和第二音频强度阈值,其中所述第一音频强度阈值小于所述第二音频强度阈值;
所述将音频强度值大于所述第一音频强度阈值的样点在所述第一音频信号中对应的样点信号确定为有效语音信号包括:
获取所述小波信号序列中第一样点,其中所述第一样点的前一样点的音频强度值小于所述第二音频强度阈值,以及所述第一样点的音频强度值大于所述第二音频强度阈值;
获取所述小波信号序列中的第二样点,所述第二样点为在所述小波信号序列中排序在所述第一样点之后,首个出现音频强度值小于所述第一音频强度阈值的样点;
确定所述小波信号序列中的所述第一样点和所述第二样点的前一样点在所述第一音频信号中对应样点的信号为所述有效语音信号中的有效语音段。


3.根据权利要求2所述的方法,其特征在于,所述第二样点与所述第一样点之间至少包括第一预设数量个连续样点。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述小波信号序列中包括目标样点在内的第二预设数量个连续样点的第一参考音频强度值的平均值作为所述目标样点的音频强度值。


5.根据权利要求4所述的方法,其特征在于,所述将所述小波信号序列中包括目标样点在内的第二预设数量个连续样点的第一参考音频强度值的平均值作为所述目标样点的音频强度值之前包括:
将所述小波信号序列中所述目标样点前一样点的音频强度值乘以平滑系数,得到所述目标样点的第二参考音频强度;
将所述小波信号序列中包括所述目标样点在内,且在所述小波信号序列中排序顺序在所述目标样点之前的所有连续样点的音频强度值的平均值乘以剩余的平滑系数,得到所述目标样点的第三参考音频强度值;
将所述第二参考音频强度值和所述第三参考音频强值相加得到的数值,作为所述目标样点的第四参考音频强度值;将包括所述目标样点在内,且在所述小波信号序列中排序顺序在所述目标样点之前的所有样点的第四参考音频强度值中的最小值,作为所述目标样点的第一参考音频强度值。


6.根据权利要求1所述的方法,其特征在于,所述获取所述小波信号序列中所有样点的音频强度值中的...

【专利技术属性】
技术研发人员:张超鹏
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1