一种基于分散注意力的SwinUnet变体医学图像分割方法技术

技术编号:38352032 阅读:10 留言:0更新日期:2023-08-05 17:25
本发明专利技术涉及一种基于分散注意力的Swin Unet变体医学图像分割方法。本发明专利技术通过构建分割模型SASUNet,结合卷积和Transformer,重新构建解码器,组合不同接收野的特征图以输出具有不同接受域大小组合的特征映射,增强SASUNet的多尺度表示;加入跳过连接模块,使编码器和解码器交叉参与以更有效地保存底层特征,还应用有效注意力机制获取多层次表示进行建模,从而提高目标区域特征的权重比。并设置训练策略和损失函数,对模型进行训练;验证已训练好的模型;本发明专利技术有效的结合Swin Unet和CNN,将Transformer能远程依赖捕捉全局信息的功能与CNN能捕捉更加详细的局部信息的功能进行结合,实现了将病灶部分从医学图像中自动分割。割。割。

【技术实现步骤摘要】
一种基于分散注意力的Swin Unet变体医学图像分割方法


[0001]本专利技术属于图像分割
,涉及到一种基于分散注意力的Swin Unet变体医学图像分割方法。

技术介绍

[0002]医学图像是医学领域中广泛使用的一种技术,它可以为医生和临床医学专家提供有关疾病的重要信息,帮助他们制定准确的诊断和治疗计划。医学图像可以来自多种来源,包括MRI、CT、X光和超声等成像技术,以及组织样本的显微镜图像等。这些图像可以提供关于肿瘤、病变和损伤等疾病的结构和功能信息,支持医生诊断和治疗的决策。医学图像的应用领域广泛,包括癌症、心血管疾病、神经系统疾病等多种疾病的诊断和治疗。传统的医学图像的处理方法通常是医学专家手动分析,所以图像的处理结果与医学专家的经验是息息相关的。而现代的医学图像分析不仅能够准确的处理医学图像,而且耗时很少,给医学专家提供了极大的便利。除了传统的手动分析外,现代医学图像通常利用计算机视觉和机器学习等技术进行自动化分析,以提高诊断的准确性和效率。其中计算机辅助诊断得到了临床医学的高度重视,其主要依赖于医学图像分割技术的支持。稳定且准确的医学图像分割算法对于帮助医生实时的监控疾病以及后续的治疗起到不可忽略的作用。
[0003]现今,医学图像分割已经成为计算机视觉的主要挑战之一。与图像分类和检测任务不同,图像分割的目的是将图像的指定部分从背景中分离出来,能够为患者提供更加准确的,更加详细的病理分析。
[0004]近年来,随着深度学习技术的发展,基于深度神经网络的生物医学图像分割方法取得了很大的进展。例如,U

Net模型采用对称的编码器

解码器结构,通过跳跃连接实现特征图的传输,可以有效地解决分割过程中信息丢失的问题。掩码局域卷积神经网络(Mask R

CNN)将快速区域卷积神经网络(Faster R

CNN)目标检测其与全卷积网络结合,实现了同时进行目标检测和分割的功能。此外,一些改进的网络结构也被提出,如稠密连接网络(DenseNet)和残差网络(ResNet),这些网络在分割任务中展现出更好的性能和鲁棒性。但是,这些网络结构虽然在分割任务中体现优秀的成果,但是卷积层的局部性限制了这些网络捕获形状和结构信息的表示能力,这对医学图像分割至关重要。为了解决这些局限性,基于Transformer的各种网络结构随之提出,例如ViT(Vision Transformer)和Swin Unet通过多头自注意机制,这使得网络能够捕获长期依赖关系。
[0005]基于以上内容,在医学图像上准确分割出目标区域仍然是一项具有挑战性的任务:1.医学图像的过程:医学图像在分割过程上还存在着一定的难度,尤其在提取图像特征时会比提取普通的RGB图片要困难,因为医学图像往往会受到诸如噪声,模糊,对比度低等问题,此外病灶区域的形状和大小的不同也会对分割的结果有着影响;2.医学图像的获取:医学图像不像自然图像,关联着患者信息,造成数据安全是医院的大忌。因此想通过正常途径拿到医院的医学图像数据是非常困难。此外,想拿到有专业人员的图像标注也非常困难。而与诊断相关的内容还要搭配临床数据,影像

临床数据打通难度更高。3.医学图像的标
注:在获取数据的基础上,深度学习结合先验知识对模型进行训练,训练集需要事先标注。由于大多数标注依赖人工识别,因此数据标注将耗费较大量人力和时间,在医疗影像领域获取具有高可靠性的标注数据也成为挑战之一。

技术实现思路

[0006]本专利技术的目的就是提供一种基于分离注意力的Swin Unet变体医学图像分割方法,用于准确分割医学图像中的病灶部分。
[0007]本专利技术具体实现步骤如下:
[0008]步骤一、对医学图像的数据进行预处理和增强:
[0009]收集医学图像,对这些图像进行预处理,扩大样本数量,并对样本图像进行归一化处理;
[0010]步骤二、构建分割模型SASUNet:
[0011]基于U

Net的编码器

解码器结构构建分割模型SASUNet,分割模型SASUNet包括编码器、解码器和跳过交叉连接模块SCCA。
[0012]编码器部分为Swin Unet中的编码器部分,解码器部分包括分散注意力模块CSA。
[0013]在编码器中:
[0014]将输入的医学图像分割成非重叠的补丁块,之后每个补丁块被传递到线性嵌入层,在线性嵌入层经过处理得到新的嵌入特征表示。线性嵌入层的输出通过多个连续的Swin transformer块处理后,将补丁的特征信息输入补丁合并层。
[0015]补丁合并层连接相邻的补丁,通过补丁合并层中线性层将相邻补丁的特征信息整合在一起,将补丁的数量减少一半,并将通道维度扩大为原来的两倍;补丁合并层的输出通过多个连续的Swin transformer块。
[0016]Swin transformer块的作用是将输入的特征图转换为更高级别的特征表示,从而使模型更好地理解输入数据。通过四次补丁合并层+Swin transformer块的处理,逐渐提取出输入图像中的高级别特征,增加模型的深度和宽度使模型具有更强的表示能力和更好的泛化性能;有效的减少计算复杂度,提高模型的效率和速度。用于更好地处理大尺度的图像,从而提高图像分割的准确性和效率。
[0017]Swin transformer块包括归一化层LN、基于窗口的多头自注意力模块W

MSA、位移的基于窗口的多头自注意力模块SW

MSA,残差连接和具有激活函数GELU非线性的双层多层感知机层MLP。其计算公式如下:
[0018][0019][0020]其中,和z
l
分别表示第l层W

MSA和MLP的输出;和z
l+1
分别表示第l+1层SW

MSA和MLP的输出;
[0021]W

MSA和SM

MSA的自注意力计算为:其中,表示查询、键和值矩阵;M2和d分别代表窗口的补丁块数和查询矩阵或
键矩阵的维度;B的值取自偏置矩阵
[0022]解码器块包括多个分散注意力块CSA和连接层,连接层与补丁合并层对应设置,每个补丁合并层的输出特征经多个连续的Swin transformer块处理后,通过跳过交叉连接模块SCCA转发给对应的连接层。
[0023]在解码器中:
[0024]每个连接层的输出特征X1均作为下一级CSA块的输入特征,编码器最后一个Swin transformer块的输出特征作为解码器第一个连接层的输入特征。
[0025]CSA块的输出特征通过连接层与对应跳过交叉连接模块SCCA的输出特征连接后作为下一个CSA块的输入特征,最后一个CSA块的输出特征经过一层1*1Conv卷积和激活函数Sigmoid转换为二进制分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分散注意力的Swin Unet变体医学图像分割方法,具体的实现步骤如下步骤一、对医学图像的数据进行预处理和增强:收集医学图像,对这些图像进行预处理,扩大样本数量,并对样本图像进行归一化处理;步骤二、构建分割模型SASUNet:基于U

Net的编码器

解码器结构构建分割模型SASUNet,分割模型SASUNet包括编码器、解码器和跳过交叉连接模块SCCA;编码器部分为Swin Unet中的编码器部分,解码器部分包括分散注意力模块CSA;在编码器中:将输入的医学图像分割成非重叠的补丁块,之后每个补丁块被传递到线性嵌入层,在线性嵌入层经过处理得到新的嵌入特征表示;线性嵌入层的输出通过多个连续的Swin transformer块处理后,将补丁的特征信息输入补丁合并层;补丁合并层连接相邻的补丁,通过补丁合并层中线性层将相邻补丁的特征信息整合在一起,将补丁的数量减少一半,并将通道维度扩大为原来的两倍;补丁合并层的输出通过多个连续的Swin transformer块;Swin transformer块的作用是将输入的特征图转换为更高级别的特征表示,从而使模型更好地理解输入数据;通过四次补丁合并层+Swin transformer块的处理,逐渐提取出输入图像中的高级别特征,增加模型的深度和宽度使模型具有更强的表示能力和更好的泛化性能;有效的减少计算复杂度,提高模型的效率和速度;用于更好地处理大尺度的图像,从而提高图像分割的准确性和效率;解码器块包括多个分散注意力块CSA和连接层,连接层与补丁合并层对应设置,每个补丁合并层的输出特征经多个连续的Swin transformer块处理后,通过跳过交叉连接模块SCCA转发给对应的连接层;在解码器中:每个连接层的输出特征X1均作为下一级CSA块的输入特征,编码器最后一个Swin transformer块的输出特征作为解码器第一个连接层的输入特征;CSA块的输出特征通过连接层与对应跳过交叉连接模块SCCA的输出特征连接后作为下一个CSA块的输入特征,最后一个CSA块的输出特征经过一层1*1Conv卷积和激活函数Sigmoid转换为二进制分割掩模,这个掩模用于与标注数据进行比较,从而计算损失并更新模型参数;所述的跳过交叉连接模块SCCA交叉参与编码器和解码器的特征以更有效地保存底层特征,帮助模型更好地感知和捕捉重要特征,从而提高医学图像分割的准确性和鲁棒性;步骤三、设置训练策略和损失函数,对模型进行训练;将经过预处理的数据集划分为训练集、测试集和验证集;使用Dice损失和BCE损失的组合来训练模型,同时采用正则化策略防止过拟合;SASUnet网络模型中使用反向传播算法对网络中的权重和偏置进行更新;训练迭代过程中利用损失函数进行参数的更新;步骤四、验证已训练好的网络模型:将已经分割好的验证集输入训练好的分割模型SASCAUNet,经过模型的分割后将医学图像中的病变部分分割出,将分割好的图像与专家判断的病变区域进行对比评估,对网络
模型进行验证;步骤五、将任意医学图像输入至验证合格的模型中,分割出病灶部分。2.如权利要求1所述的基于分散注意力的Swin Un...

【专利技术属性】
技术研发人员:张聚叶智毅王奔叶列立应长钢龚伟伟
申请(专利权)人:杭州师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1