当前位置: 首页 > 专利查询>浙江大学专利>正文

基于时空联合检测的心脏疾病分类模型构建方法技术

技术编号:37124545 阅读:26 留言:0更新日期:2023-04-01 05:20
本发明专利技术公开了一种基于时空联合检测的心脏疾病分类模型构建方法,该方法将深度学习中自监督学习的思想引入心脏疾病类型的检测分类中,考虑到心电信号的时空特性,本发明专利技术将原始信号随机动态掩码和随机打乱导联顺序然后通过重建完整原始信号和预测导联编码并构建联合损失函数来进行联合预训练,预训练完成后再在分类网络模型上利用少量有标签的数据进行微调,有效地实现减少了深度学习方法对有临床诊断标签数据的依赖。床诊断标签数据的依赖。床诊断标签数据的依赖。

【技术实现步骤摘要】
基于时空联合检测的心脏疾病分类模型构建方法


[0001]本专利技术属于心电生理检测分析
,具体涉及一种基于时空联合检测的心脏疾病分类模型构建方法。

技术介绍

[0002]临床12导联心电图(ECG)是应用最广泛的生物信号之一,它是调查病人心脏活动最常用的非侵入性测量方法,有助于诊断如心律失常、心肌梗死和动脉疾病等心脏疾病。
[0003]深度学习目前已广泛应用于不同的基于ECG的任务,如心脏疾病检测分类、生物特征识别、去噪等,其中在最为常见的心脏疾病检测分类领域涌现出了大量新颖、创新的结构,各种基于卷积神经网络和循环神经网络结构在心律失常的分类中先后被提出并且取得了理想的结果。在上述的深度学习方法中,对心电图数据进行监督学习时使用的标签只有临床医生或专业心脏病学家才能注释,这限制了可供训练的样本数量,使得标签稀缺成为该领域的一个主要挑战,而自监督学习可以有效地缓解数据缺乏的问题。全监督学习不仅依赖于昂贵的注释,还会遭受泛化错误、虚假相关性和对抗性攻击等问题;自我监督学习方法能够利用未标记的数据来学习潜在的表示,它利用未标记数据本身的结构或特征,人工生成标签,从而监督网络学习。在过去的几年中,自我监督学习从自然语言处理到语音再到计算机视觉领域都取得了巨大的进展;自监督学习即在预训练过程中,利用大量未标记的数据进行表征学习,然后使用标记数据对模型进行微调,以适应特定的任务。自监督学习的预训练模型可以帮助克服标记训练数据的缺乏并且可以利用在预训练过程中得到的初始化权重参数来缓解模型过拟合问题。
[0004]文献[Sarkar P,Etemad A.Self

supervised ECG Representation Learning for Emotion Recognition[J].2020.]利用自监督生成学习的方法将六种不同的信号变换应用于心电信号,并利用模型识别这六种信号变换作为前置任务帮助网络学习时空表征,并在情感分类的下游任务中取得良好效果。文献[Liu H,Zhao Z,She Q.Self

supervised ECG pre

training[J].Biomedical Signal Processing and Control,2021,70:103010

.]在心电图形态识别中,将自监督学习和独特的数据增强方法相结合,有效地缓解了数据不平衡和数据缺乏的问题,在8类多标签心电图分类任务上取得比临床医生更好的结果。
[0005]综上所述,现有技术主要存在以下问题:
[0006]①
有临床诊断标签的多导联心电图数据集的缺少和数据不平衡;
[0007]②
多数算法采用全监督的方法,依赖有标签的数据并且性能效果有限。

技术实现思路

[0008]鉴于上述,本专利技术提供了一种基于时空联合检测的心脏疾病分类模型构建方法,使用基于生成学习的自我监督方法用于提取出适用于各种下游任务的一般心电表征和深度特征,从而实现减少对标记数据依赖的目的。
[0009]一种基于时空联合检测的心脏疾病分类模型构建方法,包括如下步骤:
[0010](1)将获取的多导联心电信号划分为无标签的预训练数据集、有标签的迁移训练数据集和测试集;
[0011](2)对多导联心电信号进行预处理,对预训练数据集进行数据重组,并为重组后的心电信号生成对应的伪标签;
[0012](3)搭建深度特征提取网络模型,利用预训练数据集重组后的心电信号及其伪标签对该模型进行联合预训练;
[0013](4)搭建分类网络模型,将通过步骤(3)预训练得到的模型参数作为分类网络模型的初始参数,利用迁移训练数据集的心电信号及其标签对该模型进行训练;
[0014](5)将测试集中的心电信号输入至训练好的分类网络模型中,即可直接预测输出对应的心脏疾病类型结果。
[0015]进一步地,所述步骤(1)的具体实现方式为:让病人上身贴上医学多导联的体表电极贴片,利用心电图机采集病人的体表心电数据,依此获得大量的多导联心电信号,对于有标签的则根据临床诊断结果人工标记每组心电信号对应的疾病类型标签,进而按照一定比例将所有多导联心电信号划分为无标签的预训练数据集、有标签的迁移训练数据集和有标签的测试集。
[0016]进一步地,所述步骤(2)中对多导联心电信号进行预处理,具体地:使用小波技术消除心电信号中的电力线干扰、基线游移和随机噪声,将所有心电信号均转化为12
×
1000的维度大小,12为导联的数量,1000为采样点个数,进而将所有采样点数值归一化至[0,1]区间内。
[0017]进一步地,所述步骤(2)中对预训练数据集进行数据重组,即对于该数据集中任一组多导联心电信号,随机打乱其导联顺序后再进行随机动态掩码得到重组后的心电信号,生成的伪标签包括原始心电信号以及重组后心电信号的导联顺序。
[0018]进一步地,对预训练数据集进行数据重组的具体实现方式为:对于该数据集中任一组多导联心电信号,按照
Ⅰ‑Ⅱ‑Ⅲ‑
AVR

AVL

AVF

V1

V2

V3

V4

V5

V6的顺序将12条导联进行One

Hot编码,再随机打乱心电信号的导联顺序,并记录随机打乱导联顺序后的One

Hot编码作为其中一个伪标签;然后对于多导联心电信号中每条导联有20%的概率会被随机选中一段长度进行掩码,长度范围为0~1000,被掩码的部分有70%的数值设置为0,20%的数值设置为导联内随机的其他数值,10%的数值保持不变,掩码之前的原始心电信号即作为另一个伪标签。
[0019]进一步地,所述步骤(3)中的深度特征提取网络模型由编码器和分类器组成,所述编码器由8个Transformer Encoder串联构成,所述分类器为一个输出维度为12(导联数)的全连接层,利用预训练数据集经重组后得到的心电信号作为模型输入,根据伪标签通过最小化预训练损失函数L对该模型进行训练。
[0020]进一步地,所述预训练损失函数L的表达式如下:
[0021]L=γ1L
CrossEntropy
+γ2L
MSE

[0022]其中:γ1和γ2为权重系数,L
CrossEntropy
为模型输出信号的导联顺序与对应伪标签(重组后心电信号的导联顺序)的交叉熵函数,L
MSE
为模型输出信号与对应伪标签(原始心电信号)的均方误差函数,θ为正则化参数。
[0023]进一步地,所述步骤(4)中的分类网络模型由编码器和分类器组成,其中编码器结构与深度特征提取网络模型中的编码器结构相同,分类器为输出维度为N的全连接层,N为心脏疾病本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空联合检测的心脏疾病分类模型构建方法,包括如下步骤:(1)将获取的多导联心电信号划分为无标签的预训练数据集、有标签的迁移训练数据集和测试集;(2)对多导联心电信号进行预处理,对预训练数据集进行数据重组,并为重组后的心电信号生成对应的伪标签;(3)搭建深度特征提取网络模型,利用预训练数据集重组后的心电信号及其伪标签对该模型进行联合预训练;(4)搭建分类网络模型,将通过步骤(3)预训练得到的模型参数作为分类网络模型的初始参数,利用迁移训练数据集的心电信号及其标签对该模型进行训练;(5)将测试集中的心电信号输入至训练好的分类网络模型中,即可直接预测输出对应的心脏疾病类型结果。2.根据权利要求1所述的心脏疾病分类模型构建方法,其特征在于:所述步骤(1)的具体实现方式为:让病人上身贴上医学多导联的体表电极贴片,利用心电图机采集病人的体表心电数据,依此获得大量的多导联心电信号,对于有标签的则根据临床诊断结果人工标记每组心电信号对应的疾病类型标签,进而按照一定比例将所有多导联心电信号划分为无标签的预训练数据集、有标签的迁移训练数据集和有标签的测试集。3.根据权利要求1所述的心脏疾病分类模型构建方法,其特征在于:所述步骤(2)中对多导联心电信号进行预处理,具体地:使用小波技术消除心电信号中的电力线干扰、基线游移和随机噪声,将所有心电信号均转化为12
×
1000的维度大小,12为导联的数量,1000为采样点个数,进而将所有采样点数值归一化至[0,1]区间内。4.根据权利要求1所述的心脏疾病分类模型构建方法,其特征在于:所述步骤(2)中对预训练数据集进行数据重组,即对于该数据集中任一组多导联心电信号,随机打乱其导联顺序后再进行随机动态掩码得到重组后的心电信号,生成的伪标签包括原始心电信号以及重组后心电信号的导联顺序。5.根据权利要求4所述的心脏疾病分类模型构建方法,其特征在于:对预训练数据集进行数据重组的具体实现方式为:对于该数据集中任一组多导联心电信号,按照
Ⅰ‑Ⅱ‑Ⅲ‑
AVR

AVL

AVF
...

【专利技术属性】
技术研发人员:刘华锋冉翱
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1