一种基于深度可分离卷积与注意力机制的心音分类方法技术

技术编号:38885103 阅读:14 留言:0更新日期:2023-09-22 14:13
一种基于深度可分离卷积与注意力机制的心音分类方法,涉及心音信号技术领域,把心音信号分段,利用注意力机制算法提取到重要心音特征,然后通过深度卷积对每个通道平面上进行卷积运算,提取特征的局部信息,大大降低参数以及运算量,再利用多头注意力机制提取心音特征的全局信息,再对通道进行卷积运算,即在通道维度上提取局部特征,在关注局部特征的同时,也充分兼顾了心音的全局特征信息。也充分兼顾了心音的全局特征信息。也充分兼顾了心音的全局特征信息。

【技术实现步骤摘要】
一种基于深度可分离卷积与注意力机制的心音分类方法


[0001]本专利技术涉及心音信号
,具体涉及一种基于深度可分离卷积与注意力机制的心音分类方法。

技术介绍

[0002]心音是由心脏以及心血管系统机械运动产生的声音信号,通过听诊器判断心音的异常非常依赖人们的先验知识,并且极易出现错误。当前的心音分类方法有只关注心音信号局部特征的卷积神经网络方法,以及只关注心音信号全局特征的循环神经网络方法,如RNN循环神经网络,LSTM长短时记忆网络,这些方法没有很好的兼顾局部特征和全局特征的信心对心音信号进行分类。

技术实现思路

[0003]本专利技术为了克服以上技术的不足,提供了一种既考虑了心音信号的局部特征又考虑了心音信号的全局特征的基于深度可分离卷积与注意力机制的心音分类方法。本专利技术克服其技术问题所采用的技术方案是:
[0004]一种基于深度可分离卷积与注意力机制的心音分类方法,包括如下步骤:
[0005]a)获取原始心音信号X;
[0006]b)将原始心音信号X划分为n条心音段x1,x2,...,x
i
,...,x
n
,x
i
为第i条心音段,i∈{1,2,...,n},每个心音段的长度为m秒;
[0007]c)提取第i条心音段x
i
的梅尔倒谱系数,得到第i条心音段x
i
的特征x

i

[0008]d)建立心音分类模型,心音分类模型由FAP模块、TC模块、DPT模块、FC模块构成;
[0009]e)将第i条心音段x
i
的特征x

i
输入到心音分类模型的FAP模块中,输出得到特征矩阵X1;
[0010]f)将特征矩阵X1输入到心音分类模型的TC模块中,输出得到心音特征
[0011]g)将心音特征输入到心音分类模型的DPT模块中,输出得到心音特征X5;
[0012]h)将心音特征X5输入到心音分类模型的FC模块中,输出得到分类结果。
[0013]优选的,步骤a)中从Physionet2016心音数据库获取原始心音信号X。
[0014]进一步的,步骤b)中m取值为5,不足5秒长的心音段进行补零操作。
[0015]优选的,步骤c)中梅尔倒谱系数维度设置为40。
[0016]进一步的,步骤e)包括如下步骤:
[0017]e

1)通过公式Q
i
=x

i
×
W
i
计算得到第i条心音段x
i
的特征矩阵Q
i
,i∈{1,2,...,n},W
i
为随机生成的权重矩阵;
[0018]e

2)通过公式计算得到特征矩阵X1,式中ω为参数,
W
Q
为随机生成的权重矩阵,softmax(
·
)为Softmax函数,T为转置,α为阈值,α=0.25。
[0019]进一步的,步骤f)包括如下步骤:
[0020]f

1)心音分类模型的TC模块由第一卷积块、第二卷积块、第三卷积块构成;
[0021]f

2)TC模块的第一卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为2,将特征矩阵X1输入到第一卷积块中,输出得到心音特征
[0022]f

3)TC模块的第二卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为1、填充为0,将心音特征输入到第二卷积块中,输出得到心音特征
[0023]f

4)TC模块的第三卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为1,将心音特征输入到第三卷积块中,输出得到心音特征进一步的,步骤g)包括如下步骤:
[0024]g

1)心音分类模型的FAP模块由Transformer模型的位置编码层、第一深度卷积层、第一LayerNorm层批处理归一化层、多头注意力机制、第二LayerNorm层批处理归一化层、卷积层、第一Relu激活函数层、第一BatchNormalization批处理归一化层、第二深度卷积层、第二Relu激活函数层、第二BatchNormalization批处理归一化层构成,第一深度卷积层的卷积核大小为3
×
3、通道数为32、步长设置为same,卷积层的的卷积核大小为1
×
1、通道数为32、步长设置为same,第二深度卷积层的卷积核大小为3
×
3、通道数为32、步长设置为same;
[0025]g

2)将心音特征输入到FAP模块的位置编码层中,输出得到心音特征X2,将心音特征X2输入到FAP模块的第一深度卷积层中,输出得到心音特征X
′2,将心音特征X2与心音特征X
′2进行融合操作,得到心音特征将心音特征输入到FAP模块的第一LayerNorm层批处理归一化层中,输出得到心音特征将心音特征输入到FAP模块的多头注意力机制中,输出得到心音特征将心音特征与心音特征进行融合操作,得到心音特征将心音特征输入到FAP模块的第二LayerNorm层批处理归一化层中,输出得到心音特征将心音特征依次输入到FAP模块的卷积层、第一Relu
激活函数层、第一BatchNormalization批处理归一化层后,输出得到心音特征将心音特征依次输入到FAP模块的第二深度卷积层、第二Relu激活函数层、第二BatchNormalization批处理归一化层中,输出得到心音特征将心音特征与心音特征进行融合操作,得到心音特征g

3)将心音特征输入到FAP模块的位置编码层中,输出得到心音特征X3,将心音特征X3输入到FAP模块的第一深度卷积层中,输出得到心音特征X
′3,将心音特征X3与心音特征X3′
进行融合操作,得到心音特征将心音特征输入到FAP模块的第一LayerNorm层批处理归一化层中,输出得到心音特征将心音特征输入到FAP模块的多头注意力机制中,输出得到心音特征将心音特征与心音特征进行融合操作,得到心音特征将心音特征输入到FAP模块的第二LayerNorm层批处理归一化层中,输出得到心音特征将心音特征依次输入到FAP模块的卷积层、第一Relu激活函数层、第一BatchNormalization批处理归一化层后,输出得到心音特征将心音特征依次输入到FAP模块的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度可分离卷积与注意力机制的心音分类方法,其特征在于,包括如下步骤:a)获取原始心音信号X;b)将原始心音信号X划分为n条心音段x1,x2,...,x
i
,...,x
n
,x
i
为第i条心音段,i∈{1,2,...,n},每个心音段的长度为m秒;c)提取第i条心音段x
i
的梅尔倒谱系数,得到第i条心音段x
i
的特征x

i
;d)建立心音分类模型,心音分类模型由FAP模块、TC模块、DPT模块、FC模块构成;e)将第i条心音段x
i
的特征x

i
输入到心音分类模型的FAP模块中,输出得到特征矩阵X1;f)将特征矩阵X1输入到心音分类模型的TC模块中,输出得到心音特征g)将心音特征输入到心音分类模型的DPT模块中,输出得到心音特征X5;h)将心音特征X5输入到心音分类模型的FC模块中,输出得到分类结果。2.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于:步骤a)中从Physionet2016心音数据库获取原始心音信号X。3.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于:步骤b)中m取值为5,不足5秒长的心音段进行补零操作。4.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于:步骤c)中梅尔倒谱系数维度设置为40。5.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于,步骤e)包括如下步骤:e

1)通过公式Q
i
=x

i
×
W
i
计算得到第i条心音段x
i
的特征矩阵Q
i
,i∈{1,2,...,n},W
i
为随机生成的权重矩阵;e

2)通过公式计算得到特征矩阵X1,式中ω为参数,W
Q
为随机生成的权重矩阵,softmax(
·
)为Softmax函数,T为转置,α为阈值,α=0.25。6.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于,步骤f)包括如下步骤:f

1)心音分类模型的TC模块由第一卷积块、第二卷积块、第三卷积块构成;f

2)TC模块的第一卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为2,将特征矩阵X1输入到第一卷积块中,输出得到心音特征f

3)TC模块的第二卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为1、填充为0,将心音特征输入到第二卷积块中,输出得到心音特征f

4)TC模块的第三卷积块依次由卷积层、Relu激活函数层、BatchNormalization批处
理归一化层构成,卷积层的积核大小为3
×
3、通道数为64、步长为1,将心音特征输入到第三卷积块中,输出得到心音特征7.根据权利要求1所述的基于深度可分离卷积与注意力机制的心音分类方法,其特征在于,步骤g)包括如下步骤:g

1)心音分类模型的FAP模块由Transformer模型的位置编码层、第一深度卷积层、第一LayerNorm层批处理归一化层、多头注意力机制、第二LayerNorm层批处理归一化层、卷积层、第一Relu激活函数层、第一BatchNormalization批处理归一化层、第二深度卷积层、第二Relu激活函数层、第二BatchNormalization批处理归一化层构成,第一深度卷积层的卷积核大小为3
×
3、通道数为32、步长设置为same,卷积层的...

【专利技术属性】
技术研发人员:舒明雷李金萌王英龙徐鹏摇刘照阳
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1