【技术实现步骤摘要】
一种语音检测方法、装置、电子设备及存储介质
本专利技术涉及语音检测领域,尤其涉及一种语音检测方法、装置、电子设备及存储介质。
技术介绍
语音端点检测(VAD)算法通常用于判断给定的音频信号是语音还是噪声,其结果常用在语音编解码、语音增强、增益控制以及语音唤醒识别等算法中。基于深度学习的语音端点检测方法在高信噪比环境下效果很好,但是在低信噪比的环境下存在清音(发声时声带不振动发出的声音,能量较低)因为包含非稳态噪声而被误判为噪声的情况,因此,语音检测领域急需一种能够稳定识别多种现实噪音,并且不会因为包含非稳态噪声而将语音信号误判为噪声信号的语音检测方法。
技术实现思路
本专利技术提供一种语音检测方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。本专利技术一方面提供一种语音检测方法,包括:通过N个麦克风在对应角度上对第一音频信号进行采集,获得对应的N个第二音频信号,每个所述第二音频信号包括一个音频帧;对所述N个第二音频信号进行语音端点检测,确定其中X个第二音频信号 ...
【技术保护点】
1.一种语音检测方法,其特征在于,包括:/n通过N个麦克风在对应角度上对第一音频信号进行采集,获得对应的N个第二音频信号,每个所述第二音频信号包括一个音频帧;/n对所述N个第二音频信号进行语音端点检测,确定其中X个第二音频信号为语音帧,确定其中Y个第二音频信号为噪声帧,所述X加Y等于N,所述X和Y为大于等于0的整数,N为大于0的整数;/n若X和Y都不等于0,则检测所述N个第二音频信号中是否包含语音基频与谐波;/n若任意一个所述第二音频信号中包含语音基频与谐波,则将所述第一音频信号确定为语音信号。/n
【技术特征摘要】
1.一种语音检测方法,其特征在于,包括:
通过N个麦克风在对应角度上对第一音频信号进行采集,获得对应的N个第二音频信号,每个所述第二音频信号包括一个音频帧;
对所述N个第二音频信号进行语音端点检测,确定其中X个第二音频信号为语音帧,确定其中Y个第二音频信号为噪声帧,所述X加Y等于N,所述X和Y为大于等于0的整数,N为大于0的整数;
若X和Y都不等于0,则检测所述N个第二音频信号中是否包含语音基频与谐波;
若任意一个所述第二音频信号中包含语音基频与谐波,则将所述第一音频信号确定为语音信号。
2.根据权利要求1所述的语音检测方法,其特征在于,
所述N个麦克风组成均匀环形麦克风阵列,其中每个麦克风均为角度360°/N的指向性麦克风。
3.根据权利要求1所述的语音检测方法,其特征在于,所述对所述N个第二音频信号进行语音端点检测,确定其中X个第二音频信号为语音帧,确定其中Y个第二音频信号为噪声帧后,该方法还包括:
若Y等于0,则将所述第一音频信号确定为语音信号。
4.根据权利要求1所述的语音检测方法,其特征在于,所述对所述N个第二音频信号进行语音端点检测,确定其中X个第二音频信号为语音帧,确定其中Y个第二音频信号为噪声帧后,该方法还包括:
若X等于0,则将所述第一音频信号确定为噪声信号。
5.根据权利要求1或3所述的语音检测方法,其特征在于,所述将所述第一音频信号确定为语音信号后,该方法还包括:
选取所述N个第二音频信号中信噪比最高的第二音频信号,进行语音识别。
6.一种语音检测装置,其特征在于,包括:
采集模块,用于通过N个麦克风在对应角度上对...
【专利技术属性】
技术研发人员:张奇,杨国全,廖焕柱,王克彦,曹亚曦,俞鸣园,
申请(专利权)人:浙江华创视讯科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。