一种基于声音识别的分流盘铝液泄漏监测方法及系统技术方案

技术编号：39570519 阅读：13 留言：0更新日期：2023-12-03 19:21

本发明专利技术公开了一种基于声音识别的分流盘铝液泄漏监测方法及系统

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声音识别的分流盘铝液泄漏监测方法及系统

[0001]本专利技术属于安全生产的
，具体涉及一种基于声音识别的分流盘铝液泄漏监测方法及系统
。

技术介绍

[0002]铝加工行业属于高危行业，熔铸车间存在致命爆炸风险
。
近5年，全国每年均发生一起3人以上的熔铸车间爆炸的重大安全事故，对企业造成严重的人员伤亡和经济损失
。
造成爆炸的原因主要是铝液与水接触，并且形成“铝包水”的现象，使得液态水迅速气化膨胀，发生蒸汽爆炸，因此，快速检测出铝液与水接触并及时处理是防止爆炸事故的重要手段
。
[0003]目前国内尚缺乏检测铝液泄漏的研究，主要还是依靠人工经验判断，对人的经验要求较高
。
由于铝液温度在
700℃
左右，当铝液泄漏直接与水接触时，会发出一种“滋滋滋”的特殊声音，该声音可以作为铝液泄漏的判断依据
。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术的缺点与不足，提供一种基于声音识别的分流盘铝液泄漏监测方法及系统，采用轻量化神经网络，实现快速
、
精准的漏铝现象检测，对深井铸造类企业的安全生产具有重要意义
。
[0005]为了达到上述目的，本专利技术采用以下技术方案：
[0006]本专利技术的一个方面，提供了一种基于声音识别的分流盘铝液泄漏监测方法，包括下述步骤：
[0007]通过声音信号采集装置采集分流盘的声音和背景环境噪声；/>[0008]建立声音数据集以及对数梅尔频谱图数据集；
[0009]基于具有图片特征提取能力的轻量级神经网络构建声音识别器并进行训练；
[0010]利用训练好的声音识别器对采集到的分流盘的声音进行检测，判断是否存在铝液泄漏
。
[0011]作为优选的技术方案，所述声音信号采集装置包括多个双向麦克风以及混声器；所述双向麦克风设置于分流盘下方四周，且朝向分流盘底面；所述混声器将多路双向麦克风采集到的声音信号汇合成一路声音信号
。
[0012]作为优选的技术方案，所述建立声音数据集以及对数梅尔频谱图数据集具体为：
[0013]将声音信号采集装置采集到的环境声音和漏铝声音进行混音，得到多种正常声音和异常声音，从而建立声音数据集；其中正常声音仅含有环境声音，异常声音包含环境声音和漏铝声音；
[0014]从声音数据集中提取每类声音的对数梅尔频谱图，并为对数梅尔频谱图打上标签；
[0015]所述提取每类声音的对数梅尔频谱图，具体为：
[0016]对于每类声音，每次读取
x∈[1
‑
10]秒时长的音频样本，每隔
y
秒读取一次，
y≤x
，
对每个音频样本进行分帧
、
加窗处理，将处理后的声音信号
X(n)
进行快速傅里叶变换得到信号为
X(k)
，利用梅尔滤波器将
X(k)
的线性频率转换至梅尔尺度频率，并生成对数梅尔频谱图，即一张对数梅尔频谱图对应的音频时长为
x
秒，每
y
秒生产一张
。
[0017]作为优选的技术方案，所述将每个声音样本进行分帧
、
加窗处理，具体为：
[0018]将原始声音信号
S(n)
分为若干帧，且帧移
t
m
要小于帧长
t
s
的一半；
[0019]利用汉明窗对每一帧信号进行加窗处理，汉明窗的表达式如下：
[0020][0021]其中
N
为一帧中采样数，
N
＝
f
s
·
t
s
，
a
为系数，
n
为一帧中的采样次数
。
[0022]作为优选的技术方案，所述基于具有图片特征提取能力的轻量级神经网络，采用
EfficientNetV1
网络
、EfficientNetV2
网络
、MobileNetV2
网络
、MobileNetV3
网络以及
ShufflNet V2
网络中的一种；
[0023]其中，
EfficientNetV2
网络共设置了8个
stage
，
stage0
是一个普通的3×3的卷积层
、BN
层和
SiLU
激活函数，
stage1
～3均为
Fused
‑
MBConv
层，
stage4
～6均为
MBConv
层，
stage7
是一个1×1的卷积层
、
平均池化层和全连接层；且在
stage1
～6中添加了
SE
注意力机制；
[0024]其中，在
MobileNetV3
网络中将
SE
注意力机制替换为无参
3D
注意力机制，在
MobileNetV3
网络中加入
Dropout。
[0025]作为优选的技术方案，声音识别器的训练步骤为：
[0026]1)、
将对数梅尔频谱图划分为训练集与验证集；
[0027]2)、
初始化网络参数权重，超参数宽度系数设为1；
[0028]3)、
将训练集和验证集输入模型进行训练，并画出其训练过程的
loss
与
Acc
曲线；
[0029]4)、
利用
Adam
优化器更新模型的权重和偏置；
[0030]5)、
对比每个
epoch
下的分类精度
Acc
，保留
Acc
最好的一次结果，训练结束后将参数写入文件夹保存
。
[0031]本专利技术的另一个方面，还提供了一种基于声音识别的分流盘铝液泄漏监测系统，包括声音信号采集装置以及漏铝声音事件检测模块；
[0032]所述声音信号采集装置用于采集分流盘的声音和背景环境噪声；
[0033]所述漏铝声音事件检测模块包括对数梅尔频谱图生成器和声音识别器；
[0034]所述对数梅尔频谱图生成器用于根据声音信号采集装置采集的声音信号生成对数梅尔频谱图；
[0035]所述声音识别器基于具有图片特征提取能力的轻量级神经网络构建并训练，用于根据对数梅尔频谱图判断对应声音信号是否存在漏铝现象
。
[0036]作为优选的技术方案，所述声音信号采集装置包括多个双向麦克风以及混声器；所述双向麦克风设置于分流盘下方四周，且朝向分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，包括下述步骤：通过声音信号采集装置采集分流盘的声音和背景环境噪声；建立声音数据集以及对数梅尔频谱图数据集；基于具有图片特征提取能力的轻量级神经网络构建声音识别器并进行训练；利用训练好的声音识别器对采集到的分流盘的声音进行检测，判断是否存在铝液泄漏
。2.
根据权利要求1所述的一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，所述声音信号采集装置包括多个双向麦克风以及混声器；所述双向麦克风设置于分流盘下方四周，且朝向分流盘底面；所述混声器将多路双向麦克风采集到的声音信号汇合成一路声音信号
。3.
根据权利要求1所述的一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，所述建立声音数据集以及对数梅尔频谱图数据集具体为：将声音信号采集装置采集到的环境声音和漏铝声音进行混音，得到多种正常声音和异常声音，从而建立声音数据集；其中正常声音仅含有环境声音，异常声音包含环境声音和漏铝声音；从声音数据集中提取每类声音的对数梅尔频谱图，并为对数梅尔频谱图打上标签；所述提取每类声音的对数梅尔频谱图，具体为：对于每类声音，每次读取
x∈[1
‑
10]
秒时长的音频样本，每隔
y
秒读取一次，
y≤x
，对每个音频样本进行分帧
、
加窗处理，将处理后的声音信号
X(n)
进行快速傅里叶变换得到信号为
X(k)
，利用梅尔滤波器将
X(k)
的线性频率转换至梅尔尺度频率，并生成对数梅尔频谱图，即一张对数梅尔频谱图对应的音频时长为
x
秒，每
y
秒生产一张
。4.
根据权利要求3所述的一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，所述将每个声音样本进行分帧
、
加窗处理，具体为：将原始声音信号
S(n)
分为若干帧，且帧移
t
m
要小于帧长
t
s
的一半；利用汉明窗对每一帧信号进行加窗处理，汉明窗的表达式如下：其中
N
为一帧中采样数，
N
＝
f
s
·
t
s
，
a
为系数，
n
为一帧中的采样次数
。5.
根据权利要求1所述的一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，所述基于具有图片特征提取能力的轻量级神经网络，采用
EfficientNetV1
网络
、EfficientNetV2
网络
、MobileNetV2
网络
、MobileNetV3
网络以及
ShufflNet V2
网络中的一种；其中，
EfficientNetV2
网络共设置了8个
stage
，
stage0
是一个普通的3×3的卷积层
、BN
层和
SiLU
激活函数，
stage1
～3均为
Fused
‑
MBConv
层，
stage4
～6均为
MBConv
层，
stage7
是一个1×1的卷积层
、
平均池化层和全连接层；且在
stage1
～6中添加了
SE
注意力机制；其中，在
MobileNetV3
网络中将
SE
注意力机制替换为无参
3D
注意力机制，在
MobileNetV3
网络中加入
Dropout。6.
根据权利要求1所述的一种基于声音识别的分流盘铝液泄漏监测方法，其特征在于，
声音识别器的训练步骤为：
1)、
将对数梅尔频谱图划分为训练集与验证集；
2)、
初始化网络参数权重，超参数宽度系数设为1；
3)、
将训练集和验证集输入模型进行训练，并画出其训练过程的
loss
与
Acc
曲线；
4)、

【专利技术属性】
技术研发人员：闫军威，温承杰，周璇，梁艳辉，陈城，何敏，李馨，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人