当前位置: 首页 > 专利查询>南昌大学专利>正文

一种基于双重Encoder-Decoder结构的脑卒中病灶区域分割方法技术

技术编号:38325903 阅读:11 留言:0更新日期:2023-07-29 09:08
本发明专利技术公开了一种基于双重Encoder

【技术实现步骤摘要】
一种基于双重Encoder

Decoder结构的脑卒中病灶区域分割方法


[0001]本专利技术涉及医学图像分割
,具体涉及一种基于双重Encoder

Decoder结构的脑卒中病灶区域分割方法。

技术介绍

[0002]脑卒中由于高发病率、高致残率和高死亡率的特点对人类的健康状况和日常生活造成了极其严重的影响。磁共振成像(MRI)对人体软组织具有高对比度和高空间分辨率的特性,且还未发现会对人体造成损害,是临床上最常用的卒中成像方式。
[0003]从MRI图像中精确分割出脑卒中病灶对于患者病情的诊断、治疗和预后方案的制订都有极大的帮助,但脑卒中病灶的结构、形状、位置在不同患者上表现出巨大差异性。医生手动分割病灶耗时耗力,且分割质量很大程度上取决于放射科医生的经验水平,并且医生长时间的工作后可能会因为疲劳导致出现疏漏。因此,设计一种从MRI图像中自动分割病灶的方法具有重要意义。
[0004]基于深度学习的分割算法在表现上普遍优于传统的基于阈值的分割算法、基于边缘的分割算法、基于区域的分割算法以及基于聚类的分割算法等。在医学图像分割任务中,最经典的分割模型为U

Net模型,其独特的对称式Encoder

Decoder结构和解码过程中持续的特征信息融合,使得模型逐步定位并还原图片的细节信息,最后达到语义级别的目标分割。
[0005]在对特定疾病的MRI图像的进行病灶分割时,由于没有针对性的根据病灶的特点进行设计,通用的深度学习模型的分割结果通常不尽人意。因此针对特定疾病,怎样优化、设计模型使其分割出精准的病灶区域是目前研究的重要领域之一。

技术实现思路

[0006]为提升自动分割脑部MRI图像中脑卒中病灶的分割精度,本专利技术旨在提供一种基于双重Encoder

Decoder结构的脑卒中病灶区域分割方法,以提升从MRI图像中分割脑卒中病灶的精度并降低误分割概率。该方法以U

Net模型的Encoder

Decoder结构为基础,减少卷积操作数量,结合多次跳跃连接和Concatenate操作,搭建出具有双重Encoder

Decoder结构的深度学习模型;该模型结构可将模型提取的图像浅层信息与深层信息进行多次融合,达到对病灶区域的逐步定位和不断细化,即便是微小的病灶区域也能够输出精确的分割目标。
[0007]为实现上述目的,本专利技术采用如下技术方案:
[0008]一种基于双重Encoder

Decoder结构的脑卒中病灶区域分割方法,包括以下步骤:
[0009]步骤S1、图像预处理:从公开数据集中获取脑部3D

MRI图像以及3D

MRI图像对应于病灶区域的分割掩码,用于模型训练以及在测试阶段评判模型性能,对原始3D

MRI图像以及分割掩码图像进行预处理;
[0010]步骤S2、搭建基于双重Encoder

Decoder结构的深度学习模型,模型的双重Encoder

Decoder结构由两个Encoder

Decoder结构串联而成,模型的搭建过程具体可分为以下几步:
[0011]步骤S21、搭建第一个Encoder

Decoder结构:第一个Encoder

Decoder结构由卷积部分、下采样部分和上采样部分构成,卷积部分的输出特征图为下采样部分的输入特征图,卷积部分具体操作为一次卷积操作+Batch Normalization+ReLU,下采样部分的输出特征图即为上采样部分的输入特征图,下采样部分含有四次下采样——最大池化操作,每次最大池化操作后对特征图进行一次卷积操作+Batch Normalization+ReLU,上采样部分含有三次上采样——转置卷积操作,每次采样后都需要使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,之后再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;
[0012]步骤S22、搭建双重Encoder

Decoder结构:第一个Encoder

Decoder结构的最后一次卷积操作+Batch Normalization+ReLU的输出即为第二个Encoder

Decoder结构的输入特征图,第二个Encoder

Decoder结构同样由下采样部分和上采样部分构成,第二个Encoder

Decoder结构的下采样部分(简称第二下采样部分)的输出为第二个Encoder

Decoder结构的上采样部分(简称第二上采样部分)的输入,第二下采样部分含有三次下采样——最大池化操作,每次采样后使用Concatenate操作将最大池化操作后的特征图与通过跳跃连接复制过来的第一Encoder

Decoder结构中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU,第二上采样部分含有四次上采样——转置卷积操作,每次采样后使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的第一Encoder

Decoder结构和第二下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;
[0013]步骤S23、组建完整的双重Encoder

Decoder结构的深度学习模型:在双重Encoder

Decoder结构前添加一次卷积操作+Batch Normalization+ReLU,同时对双重Encoder

Decoder结构的输出添加一次通道为2、核为3
×
3的卷积操作和Softmax激活函数,到此完整的双重Encoder

Decoder结构的深度学习分割模型构建完成;
[0014]步骤S3、利用训练集数据对搭建的深度学习模型进行训练:以平衡交叉熵损失函数结合Dice损失函数得到模型损失函数L=L
BCE
+L
Dice
来降低数据集分类不平衡的影响,并使用Adam优化器来优化模型损失函数L,以获得最小的损失值,训练集中所有数据都基于该优化器训练60个轮次,并且在模型训练过程中,每使用20个Batch训练过模型后,即使用验证集数据对当前训练状态的模型进行评估验证,记录模型在验证集上的评估本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双重Encoder

Decoder结构的脑卒中病灶区域分割方法,其特征在于,包括以下步骤:步骤S1、图像预处理:从公开数据集中获取脑部3D

MRI图像以及3D

MRI图像对应于病灶区域的分割掩码,用于模型训练以及在测试阶段评判模型性能,对原始3D

MRI图像以及分割掩码图像进行预处理;步骤S2、搭建基于双重Encoder

Decoder结构的深度学习模型,模型的双重Encoder

Decoder结构由两个Encoder

Decoder结构串联而成,模型的搭建过程具体可分为以下几步:步骤S21、搭建第一个Encoder

Decoder结构:第一个Encoder

Decoder结构由卷积部分、下采样部分和上采样部分构成,卷积部分的输出特征图为下采样部分的输入特征图,卷积部分具体操作为一次卷积操作+批归一化(Batch Normalization)+ReLU,下采样部分的输出特征图即为上采样部分的输入特征图,下采样部分含有四次下采样——最大池化操作,每次采样后对特征图进行一次卷积操作+Batch Normalization+ReLU,上采样部分含有三次上采样——转置卷积操作,每次采样后都需要使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,之后再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;步骤S22、搭建双重Encoder

Decoder结构:第一个Encoder

Decoder结构的最后一次卷积操作+Batch Normalization+ReLU的输出即为第二个Encoder

Decoder结构的输入特征图,第二个Encoder

Decoder结构同样由下采样部分和上采样部分构成,第二个Encoder

Decoder结构的下采样部分(简称第二下采样部分)的输出为第二个Encoder

Decoder结构的上采样部分(简称第二上采样部分)的输入,第二下采样部分含有三次下采样——最大池化操作,每次采样后使用Concatenate操作将最大池化操作后的特征图与通过跳跃连接复制过来的第一Encoder

Decoder结构中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU,第二上采样部分含有四次上采样——转置卷积操作,每次采样后使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的第一Encoder

Decoder结构和第二下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;步骤S23、组建完整的双重Encoder

Decoder结构的深度学习模型:对双重Encoder

Decoder结构的输出添加一次通道为2、核为3
×
3、步长为1、填充为1的卷积操作和Softmax激活函数,到此完整的双重Encoder

Decoder结构的深度学习分割模型构建完成;步骤S3、利用训练集数据对搭建的深度学习模型进行训练:训练集中每次输入模型用于训练的数据批量大小(batch size)为6,当训练集中所有数据都训练过模型记为1个训练轮次,以平衡交叉熵损失函数结合Dice损失函数得到模型损失函数L=L
BCE
+L
Dice
来降低数据集分类不平衡的影响,并使用Adam优化器来优化模型损失函数L,以获得最小的损失值,训练集中所有数据都基于该优化器训练60个轮次,并且在模型训练过程中,每20个数据批(batch)训练过模型后,使用验证集数据对当前训练状态的模型进行评估验证,记录模型在验证集上的评估结果并保存评估结果最优时所对应的模型参数,60个训练轮次结束后,将
保存的模型参数导入至模型中,得到训练好的分割模型;步骤S4、将测试集图像数据输入训练好的分割模型,得到模型最后Softmax激活函数输出的预测概率矩阵,所述概率矩阵共两层,每层分辨率与输入图像相同,提取概率矩阵两层中每个点最大值的位置后,即可得到模型对测试集图像数据中脑卒中病灶区域的二值预测分割图。2.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:刘继忠徐文斌
申请(专利权)人:南昌大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1