【技术实现步骤摘要】
一种基于数据驱动的多声源智能分类识别方法
[0001]本专利技术属于声源识别
,具体涉及一种基于数据驱动的多声源智能分类识别方法。
技术介绍
[0002]在常规作战、维和和反恐作战中,狙击手能够高效率地射杀敌方人员、毁伤关键设备,给军队造成巨大人员伤亡和心理恐慌,其威胁日益增加。为了缓解狙击手带来的威胁,有必要研究高效的反狙击探测系统。其中狙击手枪声类别识别技术是反狙击探测系统的关键技术之一。
[0003]随着人工智能的发展,枪声识别技术主要借鉴常规城市噪声分类、混合枪声事件检测、医疗心音分类诊断等声源分类深度神经网络。将上述深度神经网络应用于枪声识别时存在以下问题:
[0004]1、现有网络模型在枪声识别时,无法同时保证强实时性和高准确度。
[0005]在战场复杂条件下,枪声受噪声干扰较强,传统方法无法进行准确的枪声类型判断,通过深度学习的方式可以有效地解决噪声干扰问题,而现有的循环神经网络固有的顺序属性阻碍了训练样本间的并行化,对于长序列,内存限制将阻碍对枪声样本的批量处理。卷积神经网络过于 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据驱动的多声源智能分类识别方法,其特征在于,采用包括枪声特征提取网络、枪声分类网络的深度学习网络,具体包括以下步骤:S1:利用数据采集模块采集一定时间段的枪声信息,将一维枪声信号进行数据预处理,生成对数梅尔谱图和时相谱图;S2、将S1中得到的对数梅尔谱图和时相谱图输入至枪声特征提取网络,提取输入信息中的深度特征信息;枪声特征提取网络包括多个Transformer结构编码器组,首先将S1中得到的对数梅尔谱图和时相谱图分别进行分割,切分成多张子图,再将这两种特征图的子图两两配对,并行输入线性层,将每个子图变换成一维向量,并对每个向量附加位置信息,并行输入多个串行连接的Transformer结构编码器组处理,最终将对数梅尔特征和时相特征进行融合即可得到枪声信息的深度特征向量;S3、将S2提取的枪声信息的深度特征信息输入枪声判别网络中,得到枪声类别信息:枪声判别网络由依次设置的一个平均池化层、一个线性层和一个tanh激活层组成,深度特征信息首先经过平均池化层对通道维度进行平均池化,得到的结果通过线性层变换输出维度大小,再经过tanh激活层处理即可得到枪声类别预测结果。2.根据权利要求1所述的一种基于数据驱动的多声源智能分类识别方法,其特征在于,S1中,数据预处理步骤如下:1)预加重:将枪声信号通过一个高通滤波器滤波;2)分帧:预加重之后,将信号分成多段短时帧;3)加窗:将信号分割成帧后,再对每个帧乘以一个窗函数;4)计算信号能量谱:对每一帧信号进行快速傅里叶变换操作,得到枪声信号的频谱和时相谱图,再对频谱取模的平方,得到枪声信号的功率谱;5)梅尔滤波:通过一组等高梅尔刻度的三角滤波器来提取功率谱的频带,得到梅尔谱图;6)对得到的梅尔谱图取对数,得到对数梅尔谱图。3.根据权利要求2所述的...
【专利技术属性】
技术研发人员:李剑,郭锦铭,李传坤,孙袖山,韩焱,苏新彦,
申请(专利权)人:中北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。