一种基于CNN的智能呼叫系统中的噪声去除方法技术方案

技术编号：23856220 阅读：84 留言：0更新日期：2020-04-18 11:15

本发明专利技术公开了一种基于CNN的智能呼叫系统中的噪声去除方法，包括：将电话信号切片处理，归一化和分帧预处理；截取分帧后的切片信号；对截取的信号提取其Mel频谱；将提取的Mel频谱后输入神经网络模型进行模型训练，训练好的分类模型作为噪声分类模型；将新增的电话信号切片处理并分成奇数段；对切片信号归一化和分帧预处理；对分帧后的各段切片信号分别截取；对每段截取到的信号提取其Mel频谱；将提取的Mel频谱噪声分类模型。本发明专利技术的有益效果：通过基于CNN的分类模型识别信号为人声还是噪声，可以去除电话信号中的大量噪声信号，减少信号被送往ASR翻译为文字的错误率，避免过度衰减导致的音频失真。

A noise removal method in intelligent call system based on CNN

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN的智能呼叫系统中的噪声去除方法
本专利技术涉及音频处理
，具体而言，涉及一种基于CNN的智能呼叫系统中的噪声去除方法。
技术介绍
在现有的智能呼叫系统中，电话信号会经过VAD截取，然后送往ASR转换成文字。由于背景的复杂，存在大量的噪声片段。通常的处理方法是在信号截取前使用噪声抑制方法对信号进行过滤，主要基于信号的频率分布，对噪声进行估计，常用的算法有自适应滤波器，谱减法，维纳滤波法等。自适应滤波器利用前一刻获得的滤波器参数，自动调节当前滤波器参数，以适应信号和噪声随机变化的统计特性，从而实现过滤噪声；谱减法主要是在频域对噪声的频谱进行去除，然后通过逆傅里叶变换将频域信号恢复成时域信号；维纳滤波法主要通过设计数字滤波器来去除噪声。这些噪声抑制方法，只能过滤一部分噪声，而不能将截取的噪声片段完全去除，并且随着电话信号中信噪比的减小，降噪效果随之变差，还会出现某些时段由于过度衰减导致得音频失真。
技术实现思路
为解决上述问题，本专利技术的目的在于提供一种基于CNN的智能呼叫系统中的噪声去除方法，通过基于CNN的分类模型来识别信号为人声还是噪声，可以去除电话信号中的大量噪声信号，从而减少信号被送往ASR翻译为文字的错误率，也能避免过度衰减导致的音频失真。本专利技术提供了一种基于CNN的智能呼叫系统中的噪声去除方法，包括：步骤1，将采样好的电话信号作为训练数据，基于机器学习建立噪声分类模型：步骤101，将电话信号进行切片处理，并对切片信号进行归一化和分帧的预处理...

【技术保护点】
1.一种基于CNN的智能呼叫系统中的噪声去除方法，其特征在于，包括：/n步骤1，将采样好的电话信号作为训练数据，基于机器学习建立噪声分类模型：/n步骤101，将电话信号进行切片处理，并对切片信号进行归一化和分帧的预处理；/n步骤102，对分帧后的切片信号进行截取；/n步骤103，对截取到的信号提取其Mel频谱；/n步骤104，将提取出的Mel频谱后输入神经网络模型，进行模型训练，训练好的分类模型作为噪声分类模型；/n步骤2，利用建立好的噪声分类模型，把新增的电话信号输入到具体的噪声分类模型中，得出噪声识别结果：/n步骤201，将新增的电话信号进行切片处理，并将切片信号分成奇数段；/n步骤202，对切片信号进行归一化和分帧的预处理；/n步骤203，对分帧后的各段切片信号分别进行截取；/n步骤204，对每段截取到的信号提取其Mel频谱；/n步骤205，将提取出Mel频谱输入训练好的噪声分类模型，识别出切片信号中的噪声。/n

【技术特征摘要】
1.一种基于CNN的智能呼叫系统中的噪声去除方法，其特征在于，包括：
步骤1，将采样好的电话信号作为训练数据，基于机器学习建立噪声分类模型：
步骤101，将电话信号进行切片处理，并对切片信号进行归一化和分帧的预处理；
步骤102，对分帧后的切片信号进行截取；
步骤103，对截取到的信号提取其Mel频谱；
步骤104，将提取出的Mel频谱后输入神经网络模型，进行模型训练，训练好的分类模型作为噪声分类模型；
步骤2，利用建立好的噪声分类模型，把新增的电话信号输入到具体的噪声分类模型中，得出噪声识别结果：
步骤201，将新增的电话信号进行切片处理，并将切片信号分成奇数段；
步骤202，对切片信号进行归一化和分帧的预处理；
步骤203，对分帧后的各段切片信号分别进行截取；
步骤204，对每段截取到的信号提取其Mel频谱；
步骤205，将提取出Mel频谱输入训练好的噪声分类模型，识别出切片信号中的噪声。

2.根据权利要求1所述的基于CNN的智能呼叫系统中的噪声去除方法，其特征在于，在预处理时，采用式(1)进行归一化处理，将切片信号统一经过16位量化，取值范围在-65535到65535之间，通过除以信号绝对值的最大值将信号归一化到-1到1之间；

式中，x为需要处理的切片信号，|x|为该切片信号的绝对值，为归一化后的切片信号。

3.根据权利要求1所述的基于CNN的智能呼叫系统中的噪声去除方法，其特征在于，切片信号在分帧处理时，帧长取为50ms，帧移取为12.5ms。

4.根据权利要求1所述的基于CNN的智...

【专利技术属性】
技术研发人员：伍林，尹朝阳，
申请(专利权)人：杭州哲信信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人