【技术实现步骤摘要】
一种基于特征重排和门控轴向注意力的医学图像分割方法
[0001]本专利技术涉及医学图像分割领域,特别是涉及基于端到端的医学图像分割方法。
技术介绍
[0002]随着深度卷积神经网络在计算机视觉中的普及,深度卷积神经网络被用于医学图像分割任务。像U
‑
Net、Res
‑
UNet和U
‑
Net++这样的网络已经被专门提出用于执行各种医学成像模态的图像分割。这些方法在许多困难的数据集上也取得了不错的性能,证明了CNN在学习辨别特征以从医学扫描中分割器官或病变方面的有效性。虽然基于CNN 的方法在医学图像分割领域取得了优异的性能,但由于卷积运算的内在局部性,基于CNN的方法很难学习到确切的全局和远程语义信息交互。其分割精度也不能完全满足医学应用。医学图像分割仍然是医学图像分析中的一个具有挑战性的任务。
[0003]最近,基于Transformer的方法在计算机视觉领域大放异彩。 Transformer成功的主要原因是它们能够学习输入令牌之间的长期依赖关系,可以学习到全局和远程语义信息交互。基于Transformer的变形体轴向注意力块,将2D自我注意力分解为两个1D自我注意力,并引入了位置敏感轴向注意力已经被用于用于全景分割。基于 Transformer的变形体门控轴向注意力,能够使用门控机制控制注意力信息在网络中流通。
[0004]现有的医学图像分割模型大多采用卷积层或者池化层来对原始图像进行下采样。对于上采样,则使用卷积加双次线性插值进行上采样。采用卷 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征重排和门控轴向注意力的医学图像分割方法,其特征在于包括如下步骤:步骤1.数据集获取;从现有的公开医学图像分割数据集中,选择3种数据集;步骤2.数据处理;在步骤1所获取的医学图像分割数据集上,把数据集中图像调整为相同的尺寸;再对调整后的训练样本图像进行随机的水平/垂直翻转,从而增加训练样本的多样性;步骤3.定义基于特征重排和门控轴向注意力的医学图像分割模型,该模型包括全局分支和局部分支;以步骤2处理后的训练图像以及训练图像的真实分割图作为输入;步骤4.损失函数;损失函数的作用则是用来衡量该预测值与真实样本标记之间的误差;此处采用交叉熵损失函数;步骤5.定义Adam优化器,给模型设定一个合理的学习率,初始学习率设定为0.001,模型训练过程中,学习率随批次数增加而减缓,每50个批次学习率调整为原来的0.8,从而有效抑制振荡,找到更优的网络参数;同时采用L2正则化来有效降低过拟合;步骤6.网络训练与测试,协同训练步骤3中的全局分支和局部分支,在训练的同时在每个数据集提供的测试集上进行评估,评估采用的是平均IoU以及平均F1 score。2.根据权利要求1所述的基于特征重排和门控轴向注意力的医学图像分割方法,其特征在于步骤2所述的数据处理,具体实现如下:首先,将数据集中的原始图像与真实分割图通过resize成128
×
128大小尺寸;最后,把经过resize后的训练图像以及对应的分割图像进行概率为50%的随机水平/垂直翻转。3.根据权利要求2所述的基于特征重排和门控轴向注意力的医学图像分割方法,其特征在于步骤3所述的模型全局分支和局部分支,具体实现如下:全局分支编码(enconder)部分:3
‑
1.把输入的训练样本图像使用7
×
7卷积核,步长为1,Padding设为3,保留输入的高度H与宽度W,再经过BatchNorm层以及ReLU激活函数映射得到特征块;3
‑
2.对特征块进行特征重排,把H和W面片分为2
×
2的面片块,把(B,C,H,W)下采样为(B,4C,H/2,W/2);其中B是一次输入图片的张数,C为特征块的通道数,H和W分别为特征块的高度与宽度;特征重排能够把相邻元素的特征保留在C通道上,相比采用池化层能更好的保留信息;3
‑
3.将特征重排后的特征块经过2次不改变高度与宽度的卷积加BatchNorm层以及ReLU激活函数映射得到特征块x,增强局部面片块的信息流通;3
‑
4.把特征块x输入门控轴向注意力块;一个门控轴向注意力块首先经过一个1
×
1的卷积加BatchNorm层以及ReLU激活函数映射;其次在沿着张量的宽度轴施加门控轴向注意力,公式如下式(1):其中,N表示上一次下采样后的宽度,q
ij
=W
q
′
x,k
ij
=W
k
′
x,v
ij
=W
v
′
x分别为查询、键和值;W为线性变换,x为输入,y为输出;q
ij
=W
q
′
x,表示第i行第j个元素,W
q
′
表示对x线性变换的参数
k
ij
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。