【技术实现步骤摘要】
结合Transformer改进AE的机器异常声音检测方法和装置
[0001]本专利技术涉及异常声音检测
,尤其涉及一种结合
Transformer
改进
AE
的机器异常声音检测方法和装置
。
技术介绍
[0002]自编码器
(auto
‑
encoder
,
AE)
相较于早期的统计模型方法或机器学习方法更容易实现,人工参与程度更少且结果更加精确
。
但是传统
AE
存在提取出的特征之间没有关联
、
神经网络的层数由于梯度爆炸和梯度弥散的问题无法更加深入及对模型的拟合能力有待提升等问题
。Bahdanau D
等人提出注意力机制,其在减小数据计算负担的同时让不同模态数据之间产生映射关系从而让数据之间产生上下文的联系
。He K
等人提出残差结构有效解决了梯度爆炸和梯度弥散的问题,同时又保证了数据信息在训练过程中不损失
。
基于此考虑到
Transformer
在自然语言处理领域所表现出的强大能力以及传统
AE
的优缺点,本专利利用
Transforme
改进
AE
,提出一种异常声音检测模型
(TAE)
同时对多种机器声音进行检测,通过
AUC
分数证明异常声音检测模型
(TAE)
的检测效果表现良好和声音检测准确率和 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种结合
Transformer
改进
AE
的机器异常声音检测方法,其特征在于,构建检测待检测声音的异常声音检测模型
(TAE)
,包括:改进
Transformer
,并将所述改进的
Transformer
引入自编码器
(auto
‑
encoder
,
AE)
得到异常声音检测模型
(TAE)
,具体的构建步骤如下:步骤1,改进
Transformer
,具体的改进
Transformer
步骤如下:步骤
11
,使用关系感知自我注意代替
Transformer
中的位置编码并与注意力机制结合形成一个单独结构;具体的,利用关系感知自我注意来表示音频特征各帧的位置信息
。
具体原理为,设模型输入为
X
=
{x1,x2,..,x
n
}
,经过注意力计算得到的输出为
Z
=
{z1,z2,
…
,z
n
}。
将
x
i
和
x
j
的
log
‑
mel
特征用
p
Vij
和
p
Kij
两个向量表示
。
计算所述
Z
的步骤如下
1)
计算
x
i
对
x
j
的注意力;
2)
根据所述注意力计算所述
x
i
对
x
j
的权重;
3)
根据所述权重计算
z
i
。
其中,
p
Vij
和
p
Kij
的计算方法;的计算方法;
clip(x,d)
=
max(
‑
d,min(d,x))
其中,
D
K
和
D
V
为需要学习的参数矩阵
。
步骤
12
,将所述
Transformer
中的多头注意力机制替换为混合多头注意力机制,即在所述多头注意力机制中使用混合相关性得分;具体的,在每个注意力头计算相关性得分时将其相互联系起来,即在计算完每个所述头的相关性得分后通过一组线性变换获得新的相关性得分矩阵,称之为混合相关性得分矩阵,其过程描述为阵,其过程描述为其中,用于线性变换的矩阵
λ
为一个需要学习的参数矩阵,使用所述混合相关性得分矩阵并结合关系感知自我注意后,计算注意力特征矩阵步骤
13
,将所述
Transformer
中的层归一化
(LayerNormallization
,
技术研发人员:黄秋仙,王恒,马鑫燚,刘杰,汪雨轩,张帅,郭琦,姜益民,卢锦明,
申请(专利权)人:武汉轻工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。