基于特征融合和堆叠自编码器的工业设备异常声检测方法技术

技术编号:39401588 阅读:7 留言:0更新日期:2023-11-19 15:54
本发明专利技术公开一种基于特征融合和堆叠自编码器的工业设备异常声检测方法,包括:对原始声信号进行对数梅尔能量特征提取;对原始声信号进行时域特征提取;将对数梅尔能量特征和时域特征进行串联融和,得到融和特征;将采集到的工业设备工作的声信号按前述步骤处理,获得经特征融和的训练集

【技术实现步骤摘要】
基于特征融合和堆叠自编码器的工业设备异常声检测方法


[0001]本专利技术属于异常声信号检测
,具体涉及一种基于特征融合和堆叠自编码器的工业设备异常声检测方法


技术介绍

[0002]随着智能制造时代的到来,工业生产过程的异常检测是一个重要的任务

在工业设备异常检测方面,声信号检测具有采集装备安装简单

成本低和无需接触式测量等优势

然而,实际工厂环境中的数据往往包含大量的正常声信号,而真实的异常声信号很少发生

此外,由于实验室的成本高昂和计算机模拟的可用性有限,通常很难在工业场景下收集足够数量的异常样本来进行分析

因此,如何在只利用正常声信号进行目标设备运行状态的有效检测,是一个具有挑战性的问题

[0003]传统的监督异常检测方法需要标记数据,并且只能检测到在训练集中所涵盖的异常类型,而无监督方法可以仅使用正常数据对模型进行训练,可有效避免标记数据不足的问题

自动编码器可以通过最小化重构误差作为目标,在无标签信息的情况下提取特征,但简单的自动编码器因瓶颈层的神经元相对较少而难以学习深层次的数据特征

而堆叠自编码器则可通过多次非线性变换来获得输入信号的更高级别特征表示,从而更容易识别发生在高频信息中的异常

因此,可以将无监督的堆叠自编码器应用于异常声信号检测,更好地满足工业应用的需求

此外,目前大多数工业声音异常声检测研究使用单一模态特征进行建模,并未将不同特征提取方法进行融合,虽然能取得一定的检测性能,但单一模态特征会存在特征区分度较低和对噪声敏感的情况,这将限制模型的性能以及降低模型的鲁棒性


技术实现思路

[0004]针对以上问题,本专利技术提出了一种基于特征融合和堆叠自编码器的工业设备异常声检测方法

本专利技术方法首先通过提取正常声信号的对数梅尔能量特征和时域特征
(
通过
TNet
获取
)
;在对所提取的特征进行拼接,构建正常声信号的特征训练数据集;然后通过堆叠自动编码器进行学习,使用
Adam
优化器,以输入和重构输出的均方误差作为损失和异常分数;通过正常声信号的异常分数确定阈值,构建出声信号异常检测模型

[0005]本专利技术解决其技术问题所采用的技术方案具体如下:
[0006]一种基于特征融合和堆叠自编码器的工业设备异常声检测方法,利用对数梅尔能量特征和时域特征融合作为融和特征,然后利用堆叠自编码器网络进行异常检测,其具体步骤如下:
[0007](

)
模型训练阶段
[0008]步骤1:对原始声信号进行对数梅尔能量特征提取;优选包括预加重

分帧

加窗

快速傅里叶变换和对数梅尔滤波,获得其对数梅尔能量特征
F
M

[0009]步骤2:对原始声信号进行时域特征提取;优选使用
TNet
网络获取,获得其时域特征
F
T

[0010]步骤3:将对数梅尔能量特征
F
M
和时域特征
F
T
进行串联融和,得到融和特征
F
MT

R2×
M
×
N

[0011][0012]其中,为串联操作

[0013]步骤4:将采集到的工业设备正常工作的声信号按步骤1‑
步骤3处理,得到训练数据集
X
train

{x1,x2,...,x
n
}

x
i
表示正常工作的声信号经特征提取后的数据,
i
=1,2,


n
,将采集到的工业设备正常和异常工作的声信号按步骤1‑
步骤3处理,得到验证数据集和测试集
X
test

{x1,x2,...,x
m2
}
,其中
x
i
表示声信号经特征提取后的数据,
i
=1,2,


m1或
m2,
验证集
X
val
和测试集
X
test
中均包含有正常数据和异常数据

[0014]步骤5:将训练集
X
train
输入堆叠自动编码器
(Stacked Auto

Encoders,SAE)
进行训练,
SAE
由5个结构相同的
AE
组成,单个
AE
的编码器由5层全连接层构成,维度为
512

512

512

512

32
,解码器则相反,维度为
32

512

512

512

512
,使用
Adam
优化器,当验证损失
10

epoch
内停止改善,会保存最佳模型并提前停止训练过程

[0015]步骤6:以最小化重构误差为训练目标,使用均方误差作为损失函数,损失表示为:
[0016][0017]其中,
x
i
为输入的融和特征谱图,是经
SAE
重构输出的谱图

[0018]步骤7:对于异常分数与阈值,以步骤6中的损失表示异常分数,根据训练数据集
X
train
的异常分数,计算阈值
A
θ

[0019][0020]其中,
X
为融和特征,且
X∈R
F

F

T
分别代表
Mel bin
和时间帧的数量;特征在
t
时刻通过对数梅尔滤波器组输出的几帧连接之后得到的输出特征,
ψ
t

(X
t

P
,X
t

P+1
,,...,X
t+P
)

ψ
t
∈R
D
,D

F
×
(2P+1)

P
为上下文窗口大小;
Φ
为堆叠自编码器网络;为
...

【技术保护点】

【技术特征摘要】
1.
基于特征融合和堆叠自编码器的工业设备异常声检测方法,其特征在于包括如下步骤:
(

)
模型训练阶段步骤1‑1:对原始声信号进行对数梅尔能量特征提取;步骤1‑2:对原始声信号进行时域特征提取;步骤1‑3:将对数梅尔能量特征
F
M
和时域特征
F
T
进行串联融和,得到
F
MT

R2×
M
×
N
:其中,为串联操作;步骤1‑4:将采集的工业设备正常工作的声信号按步骤1‑1‑
步骤1‑3处理,得到训练数据集
X
train

{x1,x2,...,x
n
}

x
i
表示正常工作的声信号经特征提取后的数据,
i
=1,2,


n
,将采集的工业设备正常和异常工作的声信号按步骤1‑1‑
步骤1‑3处理,得到验证数据集和测试集其中
x
i
表示声信号经特征提取后的数据,
i
=1,2,


m1或
m2,
验证集
X
val
和测试集
X
test
中均包含有正常数据和异常数据;步骤1‑5:将训练集
X
train
输入堆叠自动编码器
SAE
进行训练,
SAE
由5个结构相同的
AE
组成,单个
AE
的编码器由5层全连接层构成,维度为
512

512

512

512

32
,解码器则相反,维度为
32

512

512

512

512
,使用
Adam
优化器,当验证损失
10

epoch
内停止改善,会保存最佳模型并提前停止训练过程;步骤1‑6:以最小化重构误差为训练目标,使用均方误差作为损失函数,损失表示为:其中,
x
i
为输入的融和特征谱图,是经
SAE
重构输出的谱图;步骤1‑7:对于异常分数与阈值,以步骤1‑6中的损失表示异常分数,根据训练数据集
X
train
的异常分数,计算阈值
A
θ
:其中,
X
为融和特征,且
X∈R
F

F

T
分别代表
Melbin
和时间帧的数量;
ψ
t
为特征在
t
时刻通过对数梅尔滤波器组输出的几帧连接之后得到的输出特征,
ψ
t

(X
t

P
,X
t

P+1
,,...,X
t+P
)

ψ
t
∈R
D
,D

F
×
(2P+1)

P
为上下文窗口大小;
Φ
为堆叠自编码器网络;为
l2正则化;
(

)
异常检测阶段对于采集的未知声信号数据,判断其异常与否:步骤2‑1:按步骤1‑1和步骤1‑2提取对数梅尔能量特征
F
M
和时域特征
F
T
,并通过串联分方式融和为
F
MT
;步骤2‑2:将融和特征
F
MT
后得到的样本
x
输入堆叠自动编码器
SAE
,得到
x
的重构通过均方误差计算重构损失作为异常分数
S
;步骤2‑3:将所得异常分数
S
与步骤1‑7的阈值

【专利技术属性】
技术研发人员:王亚威周玉蓉张巧灵
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1