一种心电图数据增强方法、系统、介质、设备及终端技术方案

技术编号:38770577 阅读:20 留言:0更新日期:2023-09-10 10:43
本发明专利技术属于数据增强处理技术领域,公开了一种心电图数据增强方法、系统、介质、设备及终端,系统构建双向长短期记忆网络与通道

【技术实现步骤摘要】
一种心电图数据增强方法、系统、介质、设备及终端


[0001]本专利技术属于数据增强处理
,尤其涉及一种心电图数据增强方法、系统、介质、设备及终端。

技术介绍

[0002]目前,心电图(Electrocardiography,ECG)可以客观反映心脏各部位的生理状况和工作状态,是诊断心律失常疾病的重要手段和主要依据。MIT

BIH心律失常数据库是当前世界上公认的心电信号数据库之一,被广泛应用于心律失常分类和临床研究中。但MIT

BIH数据库的ECG数据存在严重的不平衡性,这可能会使ECG分类模型在技术上具有较大挑战。大多数研究使用的分类方法往往应用于主要疾病类,而忽略了次要疾病类的识别。因此,为了能够获得更好的分类性能,亟需针对次要疾病类样本使用良好的数据增强技术。
[0003]通过上述分析,现有技术存在的问题及缺陷为:现有ECG分类方法往往应用于主要疾病类,而忽略了次要疾病类的识别,这会导致分类的相对准确率较差。目前缓解数据不平衡的经典数据增强方法有平移、旋转和加噪声等,通过修改原始训练集来创建合成数据,这些方法的使用已被证明能够缓解数据不平衡的问题,但处理过程也可能破坏心电图的相关特征。生成式模型的目标是学习输入数据的分布,然后从学习到的分布中生成新的样本,优势是既能实现数据增强,同时不会影响到原有的数据集。

技术实现思路

[0004]针对现有技术存在的问题,本专利技术提供了一种心电图数据增强方法、系统、介质、设备及终端,尤其涉及一种BiLSTM+CBAM特征融合生成对抗网络的心电图数据增强方法、系统、介质、设备及终端。
[0005]本专利技术是这样实现的,基于生成对坑网络(Generativeadversarial network,GAN)的心电图数据增强方法为:系统构建双向长短期记忆网络BiLSTM(Bi

directional Long Short

Term Memory,BiLSTM)与通道

空间注意力机制(Convolutional Block Attention Module,CBAM)相结合的生成对抗网络模型。GAN由生成器和判别器组成,生成器含有BiLSTM的分支用于捕捉时序序列的依赖关系,从而保留疾病的关键特征;含有CBAM的分支用于对输入的特征图进行自适应特征细化。最后将两条分支进行特征融合后通过一层反卷积层将序列重塑为长度为300x1的一维序列。采用深度卷积生成对抗网络(Deep Convolution Generative Adversarial Networks,DCGAN)判别器的思想,判别器使用具有三层卷积核大小为1x3卷积层的网络结构。在GAN的训练过程中,生成器和判别器通过对抗学习生成逼真的ECG心拍,最后加入分类模型的训练集,进而实现心电图数据增强。
[0006]进一步,心电图数据增强方法包括以下步骤:
[0007]步骤一,数据预处理:从采集的ECG信号中去除高频和低频来消除噪声,应用巴特沃斯带通滤波器从ECG信号中提取最有价值的信息;
[0008]步骤二,数据划分:根据MIT

BIH数据库标注的R峰位置将ECG记录分割成多个ECG
心拍,分割后的ECG心拍分为训练集和测试集;
[0009]步骤三,构建BiLSTM+CBAM特征融合生成对抗网络模型;
[0010]步骤四,利用评价指标对生成对抗网络模型的性能进行评价。
[0011]进一步,步骤一中,对原始采集的ECG记录应用巴特沃斯带通滤波器去除高频和低频来消除噪声。
[0012]进一步,步骤二中,心电图数据增强方法基于MIT

BIH数据库中的14个疾病类别,根据美国医疗器械促进协会(Association for the Advancement of Medical Instrumentation,AAMI)的建议,丢弃102、104、107和217四条记录。使用MIT

BIH数据库中标记的R峰位置对每条记录分割成多个心拍,心拍长度为取R峰前100个采样点,R峰后200个采样点,含R峰共300个采样点。最后将所有的心拍数据分为测试集和训练集,在数据增强阶段仅使用到训练集中的疾病类别的心拍数据。
[0013]进一步,步骤三中,将长度为100的随机噪声输入到BiLSTM+CBAM特征融合生成对抗网络模型的生成器,生成器利用从原始心拍数据学习到的数据分布将输入噪声生成新的ECG心拍样本。判别器的输入是原始心拍数据,即各个疾病类别的数据,通过与生成器的对抗学习不断地迭代训练,生成器网络逐渐学习到如何生成更逼真的数据,而判别器网络则逐渐变得更加准确。最终,整个GAN模型的输出为生成器生成的逼真ECG心拍数据。
[0014]生成器模型包括两条分支,第一条分支使用编码器(Encoder)、BiLSTM和解码器(Decoder)设计;编码器包括两个反卷积层,具有不同的内核大小和相同特征图;解码器具有两个不同内核大小的反卷积层。另一条分支使用编码器、CBAM和解码器设计;通过BiLSTM保留疾病的关键特征和CBAM对输入的特征图进行自适应特征细化;最后将两条分支的输出进行特征融合,再经过一层反卷积层将序列重塑为长度为300x1的一维序列,并采用Tanh激活函数对网络输出进行处理。
[0015]采用DCGAN判别器的思想,判别器模型由三层Conv1D层、一层Dropout层、一层Flatten层和一层Dense层构成,卷积核大小为1x3,特征图大小分别为32,128和256以及步长为2。卷积层的输出被全连接层映射为1
×
1的值,并通过sigmoid激活函数进行处理,作为判别器的输出值。
[0016]对于GAN的训练过程,生成器使用Adam优化器,学习率为0.0005;判别器使用RMSprop优化器,学习率为0.0001;本专利技术针对大多数疾病类别将迭代次数设定为500个epoch,值得一提的是,GAN的训练次数并不是越多越好,通常判别GAN模型训练的好坏为两个网络的训练是否达到纳什均衡。
[0017]进一步,步骤四中,利用百分比均方根误差方(PRD)、均方根误差(RMSE)、离散Fr
é
chet距离(FD)来度量BiLSTM+CBAM特征融合生成对抗网络模型生成效果的优劣,各指标数值越小,GAN的生成性能越好。各个评价指标的公式如下:
[0018][0019][0020]FD(P,Q)=min{||d||}。
[0021]本专利技术的另一目的在于提供一种应用所述心电图数据增强方法的心电图数据增
强系统,心电图数据增强系统包括:
[0022]数据预处理模块,对原始采集的ECG记录应用巴特沃斯带通滤波器去除高频和低频来消除噪声;
[0023]数据划分模块,用于将来自MIT

BIH数据库中导联II分割后的ECG心本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种心电图数据增强方法,其特征在于,心电图数据增强方法包括:系统构建双向长短期记忆网络BiLSTM与通道

空间注意力机制CBAM特征融合的生成对抗网络模型;GAN由生成器和判别器组成,生成器模型含有BiLSTM的分支用于捕捉时序序列的依赖关系,从而保留疾病的关键特征;含有CBAM的分支用于对输入的特征图进行自适应特征细化;判别器使用具有三层卷积核大小为1x3卷积层的网络结构;在GAN的训练过程中,生成器和判别器通过对抗学习,最终生成逼真的ECG心拍数据;最后可将生成的ECG心拍数据加入分类模型的训练集,实现心电图数据增强。2.如权利要求1所述的心电图数据增强方法,心电图数据增强方法包括以下步骤:步骤一,数据预处理:对原始采集的ECG记录应用巴特沃斯带通滤波器去除高频和低频来消除噪声;步骤二,数据划分:将来自MIT

BIH数据库中导联II分割后的ECG心拍分为训练集和测试集;步骤三,构建BiLSTM+CBAM特征融合生成对抗网络模型;步骤四,利用评价指标对生成对抗网络模型的性能进行评价。3.如权利要求2所述的心电图数据增强方法,其特征在于,步骤一中,使用巴特沃斯带通滤波器去除原始ECG数据中的噪声干扰;根据AAMI的建议,丢弃102、104、107和217四条记录。R峰已在MIT

BIH数据库中标记,每个心拍取R波前100个采样点,R波后200个采样点,含R波共300个采样点。4.如权利要求2所述的心电图数据增强方法,其特征在于,步骤二中,心电图数据增强方法基于MIT

BIH数据库中的14个疾病类别,仅使用来自导联II的心拍被分为训练集和测试集,在数据增强阶段仅使用训练集中的心拍数据。5.如权利要求2所述的心电图数据增强方法,其特征在于,步骤三中,BiLSTM+CBAM特征融合生成对抗网络模型的生成器输入是长度为100的随机噪声,判别器的输入是原始心拍,将生成器生成的数据作为输出,并用判别器判别生成数据的真假;生成器模型包括两条分支,第一条分支使用编码器、BiLSTM和解码器设计;编码器包括两个反卷积层,具有不同的内核大小和相同特征图;解码器具有两个不同内核大小的反卷积层;另一条分支使用编码器、CBAM和解码器设计;通过BiLSTM...

【专利技术属性】
技术研发人员:周飞燕李佳佳
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1