The invention relates to the field of computer technology, and proposes a detection method, device, storage medium and mobile terminal for audio noise. The detection methods of the audio noise include: acquiring the input speech signal; subdividing the speech signal into frames; extracting the GFCC features and Gabor features of the speech signal after subdividing the frames; sequentially inputting the extracted GFCC features and Gabor features into the N-layer convolution layer, one-layer full connection layer and one-layer soft Max layer of the CNN neural network model to obtain the noise of the speech signal. Acoustic detection results, 3 < N < 5. The CNN network structure is a simplified structure without pooling layer, and the number of convolution layers is small, which can greatly reduce the computational load, so that the calculation of the CNN network model can be completed by using the processor of mobile terminal itself without connecting to the server. Therefore, even if the mobile terminal is offline, it is enough to detect the noise in the speech signal and has good real-time performance.
【技术实现步骤摘要】
一种音频噪声的检测方法、装置、存储介质和移动终端
本专利技术涉及计算机
,尤其涉及一种音频噪声的检测方法、装置、存储介质和移动终端。
技术介绍
语音助手是一款智能型的手机应用,通过即时问答的智能交互,能够帮助用户解决很多问题。在使用语音助手时,移动终端在获得用户发出的语音后,需要检测语音信号中的噪声,目前通常采用分类器(SVM,随机森林等),或者使用神经网络利用MFCC等声学特征来检测音频噪声。然而,由于采用这些方式的计算量十分巨大,移动终端在采集到语音信号之后,需要将语音信号通过网络发送至计算能力更强大的服务器进行计算,这就导致语音识别的反应时间较长,而且若移动终端处于离线状态,也无法执行。
技术实现思路
有鉴于此,本专利技术实施例提供了一种音频噪声的检测方法、装置、存储介质和移动终端,即使移动终端处于离线状态,也很够检测语音信号中的噪声,且实时性好。本专利技术实施例的第一方面,提供了一种音频噪声的检测方法,包括:获取输入的语音信号;对所述语音信号进行分帧;分别提取分帧后的所述语音信号的GFCC特征和Gabor特征;将提取到的所述GFCC特征和Gabor特征依 ...
【技术保护点】
1.一种音频噪声的检测方法,其特征在于,包括:获取输入的语音信号;对所述语音信号进行分帧;分别提取分帧后的所述语音信号的GFCC特征和Gabor特征;将提取到的所述GFCC特征和Gabor特征依次输入CNN神经网络模型的N层卷积层、一层全连接层以及一层softmax层,得到所述语音信号的噪声检测结果,3≤N≤5。
【技术特征摘要】
1.一种音频噪声的检测方法,其特征在于,包括:获取输入的语音信号;对所述语音信号进行分帧;分别提取分帧后的所述语音信号的GFCC特征和Gabor特征;将提取到的所述GFCC特征和Gabor特征依次输入CNN神经网络模型的N层卷积层、一层全连接层以及一层softmax层,得到所述语音信号的噪声检测结果,3≤N≤5。2.根据权利要求1所述的音频噪声的检测方法,其特征在于,还包括:当获取输入的语音信号时,记录当前的系统时间作为噪声检测的起始时间;在得到所述语音信号的噪声检测结果时,记录当前的系统时间作为噪声检测的结束时间;根据所述起始时间和所述结束时间计算得到噪声检测时间;根据所述噪声检测时间调整所述卷积层的数量N的大小。3.根据权利要求2所述的音频噪声的检测方法,其特征在于,所述根据所述噪声检测时间调整所述卷积层的数量N的大小包括:判断所述噪声检测时间是否超过预设的第一阈值;若所述噪声检测时间超过所述第一阈值,则进一步判断所述卷积层的数量N是否大于3;若所述卷积层的数量N大于3,则将所述卷积层的数量N调整为N-1。4.根据权利要求1至3中任一项所述的音频噪声的检测方法,其特征在于,还包括:监测系统的CPU使用率和内存使用率;根据所述CPU使用率和内存使用率调整所述卷积层的数量N的大小。5.根据权利要求4所述的音频噪声的检测方法,其特征在于,所述根据所述CPU使用率和内存使用率调整所述卷积层的数量N的大小包括:判断所述CPU使用率或内存使用率是否超过预设的第二阈值;若所述CPU使用率或内存使用率超过所述第二阈值,则进一步判断所述卷积层的数量N是否大于3;若所述卷积层的数量N大于3,则将所述卷积层的数量N调整为N-1。6.一种音频噪声的检测装置,其特征在于,包括:语音信...
【专利技术属性】
技术研发人员:庞烨,周新宇,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。