【技术实现步骤摘要】
一种基于神经网络的轻量环境声音识别方法
[0001]本专利技术涉及航空管理领域,具体涉及一种基于神经网络的轻量环境声音识别方法。
技术介绍
[0002]生活中人们通过声音发送、传递、获取信息。随着物联网技术的不断发展和计算机处理声音信号的能力不断提升,让计算机设备自动感知、识别、处理声音信号的需求也随之而来,计算机听觉(Computer Audition)的研究领域也逐渐被人们所关注。环境声音识别(Environment sound recognition)是计算机听觉领域的重要研究方向之一。环境声音识别是指让计算机设备以一定的算法方式对采集到的环境声音进行处理与识别的过程。
[0003]环境声音识别总体可分为传统的机器学习方法和神经网络方法。传统方法中声音特征提取方法有线性预测编码系数(Linear Predictive Coding,LPC)、线性预测倒谱系数(near Predictive Cepstrum Coefficient,LPCC)、梅尔频率倒谱系数(Mel
‑
Frequency C ...
【技术保护点】
【技术特征摘要】
1.一种基于神经网络的轻量环境声音识别方法,其特征在于,包括如下步骤:S1、获取轻量环境声音并进行预处理;S2、构建环境声音分类网络并利用环境声音分类网络对预处理后得到的特征参数进行分类;S3、判断环境声音分类结果是否符合预设,若是则对其进行随机增强,若不是,则输出原始音频;S4、将符合预设的环境声音输入环境声音增强生成对抗神经网络并多次迭代,直至神经网络达到拟合态,输出增强后的声音和其对应的分类并存储。2.根据权利要求1所述的基于神经网络的轻量环境声音识别方法,其特征在于,所述S1中预处理具体包括用log
‑
mel提取声音特征并进行归一化。3.根据权利要求1所述的基于神经网络的轻量环境声音识别方法,其特征在于,所述S2中构建环境声音分类网络的方式为:使用bottleneck结构替换CNN网络中的卷积层,将原始CNN网络拆分为depthwise和pointwise的卷积组合,其计算量压缩为:其中,W表示卷积层输入数据的宽度;H表示卷积层输入数据的高度;C表示卷积层输入数据的通道数;k表示卷积层的卷积核个数。4.根据权利要求3所述的基于神经网络的轻量环境声音识别方法,其特征在于,所述S2对预处理后得到的特征参数进行分类的具体方式为:S21、对预处理后的轻量环境声音进行深度卷积计算,利用输入数据通道数的个数个卷积核对输入的轻量环境声音的每一个单独的通道做卷积运算后,将运算结果按照输入通道的顺序叠加在一起;计算量为H
×
W
×
C
×3×
3;S22、利用SE算法分别计算对空间的卷积核和对通道权重的卷积核,将不同维度上的数据提取总体特征并编码,得到注意力的全局的特征向量;计算量为H
×
W
×
C...
【专利技术属性】
技术研发人员:汤理文,黄渲宝,杜怀云,
申请(专利权)人:四川天中星航空科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。