一种自动统计弹药发射次数的方法技术

技术编号：40818724 阅读：6 留言：0更新日期：2024-03-28 19:37

本发明专利技术涉及一种自动统计弹药发射次数的方法，属于声音信号处理和深度学习技术领域。本发明专利技术输入要识别的弹药发射音频数据，进行分帧操作，生成特征图，提取多尺度特征并进行融合，提取上下文特征，并提取组合特征，进行特征分类和分类结果优化，统计弹药发射次数。本发明专利技术通过多尺度特征提取、融合，两次Bi‑GRU网络有效地捕获音频时间序列数据的上下文特征，能够兼顾识别速度和精度，精确识别弹药发射声音并自动统计枪炮弹药发射次数。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于声音信号处理和深度学习，具体涉及一种自动统计弹药发射次数的方法。

技术介绍

1、军事、公安、人工降雨等领域使用的枪炮能够发射的弹药次数是有限的，超过使用次数限制将会影响其射击精度，所以，精确统计枪炮的弹药发射次数至关重要。实际使用中，人们通常是在枪炮使用结束一段时间之后才会人工记录弹药发射次数，存在一定的记忆误差，无法实现精确统计的目的。

2、要精确统计弹药发射次数，需要先识别出弹药发射声音的起止时间。这需要采用声音事件检测(sound event detection，sed)技术，声音事件检测的目的是检测出音频中每一类声音的起止时间并标注出来。早期的声音事件检测主要是基于信号处理与传统的机器学习方法，首先通过人工提取声学特征，再采用机器学习的方法来训练分类器。传统分类模型在提取声音信号特征时，常常离不开复杂的数据预处理和特征工程，导致最后的识别结果并不理想。

3、在深度学习中，循环卷积神经网络(crnn)是卷积神经网络(cnn)与循环神经网络(rnn)的结合，能利用cnn强大的特征提取能力提取频率不变性特征，又能利用双向rnn获取声音事件的长时间信息。然而，不同类型枪炮的弹药发射声音持续时间不同，声音时间和频率的成分也存在差异。采用原始的crnn模型，只能在单一尺度上进行特征提取，直接用于声音事件检测的识别精度不高。

4、因此，为精确识别弹药发射声音并统计弹药发射次数，迫切需要一种兼顾识别速度和精度自动化识别方法。本专利技术正是为满足这种现实需求而产生的。

>技术实现思路

1、(一)要解决的技术问题

2、本专利技术要解决的技术问题是如何提供一种自动统计弹药发射次数的方法，以解决精确识别弹药发射声音并统计弹药发射次数的问题。

3、(二)技术方案

4、为了解决上述技术问题，本专利技术提出一种自动统计弹药发射次数的方法，该方法包括如下步骤：

5、s1、弹药发射音频获取：输入要识别的弹药发射音频数据，进行分帧操作；

6、s2、特征图生成：对分帧后的音频信号进行傅里叶变换、mel滤波器组、对数变换、归一化操作，生成log-mel频谱图，即二维特征图；

7、s3、多尺度特征提取：利用多尺度卷积提取二维特征图的4个不同尺度上的特征；

8、s4、多尺度特征融合：将步骤s3中生成的不同尺度上的4组特征图进行拼接，将不同尺度提出的特征进行融合；拼接之后再进行卷积操作，减小特征图的通道数，使其跟原输入特征图通道数保持一致；

9、s5、上下文特征提取：将步骤s4中输出的特征图输入bi-gru网络，处理完后再次输入bi-gru网络，提取全局上下文信息并输出长期和短期依赖特征；

10、s6、组合特征提取：将步骤s5输出的结果输入全连接层神经网络，利用神经网络对s5的特征进行线性组合，将组合特征表示映射到弹药发射音频的样本标记空间；

11、s7、特征分类：将步骤s6输出的结果输入神经网络的激活函数，这里采用sigmoid函数，将输出值映射到0到1之间，计算音频组合特征对应的类别概率，区分弹药发射音频和其他类别的音频，并计算每次弹药发射的起止时间；

12、s8、分类结果优化：对弹药发射分类结果进行后处理，包括合并相邻弹药发射声音、删除持续时间较短弹药发射音频声音；

13、s9、弹药发射次数统计：根据弹药发射的起止时间统计弹药发射次数。

14、(三)有益效果

15、本专利技术提出一种自动统计弹药发射次数的方法，本专利技术提供一种自动统计弹药发射次数的方法，通过多尺度特征提取、融合，两次bi-gru网络有效地捕获音频时间序列数据的上下文特征，能够兼顾识别速度和精度，精确识别弹药发射声音并自动统计枪炮弹药发射次数。

本文档来自技高网...

【技术保护点】

1.一种自动统计弹药发射次数的方法，其特征在于，该方法包括如下步骤：

2.如权利要求1所述的自动统计弹药发射次数的方法，其特征在于，所述S1中，输入要识别的弹药发射音频数据，音频采样率至少达到44100Hz。

3.如权利要求1所述的自动统计弹药发射次数的方法，其特征在于，所述S1中，分帧操作包括：音频信号进行分段，每段为0.5秒，将声音重采样为44.1Khz，即每个0.5秒的声音片段由22050个采样点组成，分帧时将帧长定为2048，帧移取512，同时对每帧加汉宁窗，这样每个声音片段被分为44帧。

4.如权利要求3所述的自动统计弹药发射次数的方法，其特征在于，所述S2中，每个声音片段经过Log-Mel变换后得到的是128*44的数据结构。

5.如权利要求3所述的自动统计弹药发射次数的方法，其特征在于，所述S2中，所述归一化处理是将一组数据的值映射为0到1之间，最小值映射为0，最大值映射为1。

6.如权利要求1-5任一项所述的自动统计弹药发射次数的方法，其特征在于，所述S3具体包括：在步骤S2生成的特征图上采用4个尺度不同

7.如权利要求6所述的自动统计弹药发射次数的方法，其特征在于，尺寸为3*3、5*5、7*7的3个卷积均采用形变卷积。

8.如权利要求6所述的自动统计弹药发射次数的方法，其特征在于，所述步骤S5中，Bi-GRU网络用于捕获音频时间序列数据的上下文特征，使当前时刻隐藏状态不仅与之前时刻隐藏状态有关而且与未来时刻隐藏状态有关。

9.如权利要求6所述的自动统计弹药发射次数的方法，其特征在于，所述S8中，删除持续时间小于0.5秒的短时弹药发射音频。

10.如权利要求6所述的自动统计弹药发射次数的方法，其特征在于，所述步骤S9包括：根据步骤S8的分类结果，每段音频分为弹药发射音频和非弹药发射音频，连续的弹药发射音频记作一次弹药发射，以此统计弹药发射次数。

...

【技术特征摘要】

1.一种自动统计弹药发射次数的方法，其特征在于，该方法包括如下步骤：

2.如权利要求1所述的自动统计弹药发射次数的方法，其特征在于，所述s1中，输入要识别的弹药发射音频数据，音频采样率至少达到44100hz。

3.如权利要求1所述的自动统计弹药发射次数的方法，其特征在于，所述s1中，分帧操作包括：音频信号进行分段，每段为0.5秒，将声音重采样为44.1khz，即每个0.5秒的声音片段由22050个采样点组成，分帧时将帧长定为2048，帧移取512，同时对每帧加汉宁窗，这样每个声音片段被分为44帧。

4.如权利要求3所述的自动统计弹药发射次数的方法，其特征在于，所述s2中，每个声音片段经过log-mel变换后得到的是128*44的数据结构。

5.如权利要求3所述的自动统计弹药发射次数的方法，其特征在于，所述s2中，所述归一化处理是将一组数据的值映射为0到1之间，最小值映射为0，最大值映射为1。

6.如权利要求1...

【专利技术属性】
技术研发人员：梁翠萍，贺志洋，李子健，魏宇鋆，张丹，蒋遂平，
申请(专利权)人：北京计算机技术及应用研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人