一种基于改进的UNet的舌体分割方法技术

技术编号：41364339 阅读：4 留言：0更新日期：2024-05-20 10:12

本发明专利技术公开了一种基于改进的UNet的舌体分割方法，属于图像分割领域，包括以下步骤：采集病人舌象数据制作用于网络训练的数据集；结合深度空间转化卷积和Swin‑Transformer，提出改进的网络编码器结构SPD‑Swin‑Transformer，通过使用跨尺度特征融合浅层和深层特征，作为跳跃连接的输入；将使用分离与共享卷积及ASPP架构搭建的SSASPP，加入改进的UNet的瓶颈层；基于自适应平均池化和空洞卷积优化的多尺度注意力机制，构建高效自适应多尺度注意力模块；步骤五，将数据集输入改进后的UNet网络中进行训练和评价。本发明专利技术提升了网络模型对多种特征的学习能力和对浅层特征的敏感性，增强了网络的跳跃连接层和瓶颈层对特征的感知能力，增强了网络模型的泛化能力和鲁棒性，从而有效提高了舌体分割精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像分割，尤其涉及一种基于改进的unet的舌体分割方法。

技术介绍

1、在现有技术中，随着基于深度学习的图像处理方法研究的不断深入，传统的分割方法对于数据量小、目标特征变化大的医学图像难以实现快速及准确的处理，已经逐渐将深度学习应用到复杂的医学图像处理任务中。目前主流的图像分割方法主要分为基于阈值的分割、基于边缘的分割、基于区域的分割、基于聚类分析的分割、基于图论的分割及基于深度学习的分割。基于阈值的方法直接利用图像的灰度特性对目标进行分割，对相差很大的不同目标和背景可以进行有效的分割；基于边缘的方法根据目标边缘的像素灰度值变化实现分割，在低噪声干扰，区域之间的性质差别很大的图像中适用；基于区域的方法通过将图像分成若干个区域完成目标的分割，需要图像具有相似的特征，并且在图像内部具有一定的连续性；基于聚类分析的方法是根据特征相似性将图像每个像素分配到其中一组，通常用在较大数据集的图像分割任务；基于图论的方法使用图像中像素之间的相似度来构建一个图，然后使用图论算法将图像分割成多个区域，其对背景重叠及多目标分割有着优异表现，但对图像中的噪声和边缘处理能力较差，容易产生过分割或欠分割的情况；基于深度学习的方法学习并理解图像的语义信息，实现图像的语义级分割，相较于传统图像分割方法大多仅利用图像的表层信息，在拥有复杂语义信息的图像上则表现不佳，其实现了更加精准且高效的分割。在医学图像处理领域中，在面对小样本数据及复杂特征的情况下，需要分割模型具有较高的精确度，基于深度学习的方法在对医学图像的分割任务中表现出优异的分割精度，可以

2、通常，在采集的图像中舌体周围往往伴有牙齿、嘴唇和鼻孔等多种干扰因素，例如嘴唇与舌体纹理和颜色特征相似、牙齿遮挡舌体及鼻孔与舌体阴影相似等干扰因素，这些因素对于准确分割舌体带来了一定的影响。同时，不同人群的舌体可能表现出较大差异，一定程度上导致了深度学习网络的理解图像特征困难的情况。因此，在图像复杂的背景环境下准确的分割舌体是一项艰巨的挑战，需要分割模型具有较高的精准度和较强的解决复杂问题能力，因此需要不断提高舌体分割模型的信息信息能力、增强网络应对干扰的鲁棒性。

技术实现思路

1、为解决上述问题，本专利技术提供一种基于改进的unet的舌体分割方法，提升了模型在复杂背景环境下的分割精度，减少了网络训练对数据量的依靠，增强了网络在处理多种干扰因素的能力，从而提高了网络的泛化能力和鲁棒性。

2、为实现上述目的，本专利技术提供了一种基于改进的unet的舌体分割方法，包括以下步骤：

3、步骤一，采集若干例病人舌象数据，人工处理采集的舌象数据，并将处理后的舌象数据制作用于网络训练的数据集；

4、步骤二，结合深度空间转化卷积和swin-transformer，提出改进的网络编码器结构spd-swin-transformer，提取浅层和深层特征，通过使用跨尺度特征融合的方式合并浅层和深层特征，并将融合后的特征作为跳跃连接的输入；

5、步骤三，将使用分离与共享卷积及aspp架构搭建的ssaspp，加入改进的unet的瓶颈层，对编码器与解码器的连接部分进行优化；

6、步骤四，基于自适应平均池化和空洞卷积优化的多尺度注意力机制，构建高效自适应多尺度注意力模块，高效自适应多尺度注意力模块用于处理编码器输入至跳跃连接的特征图，并将处理完成的特征图输送至解码器；

7、步骤五，将步骤一中的数据集输入改进后的unet网络中进行训练，并进一步对训练得到的模型进行评估和优化，完成基于改进的unet的舌体分割。

8、优选的，步骤一中，在确定设备、光线环境和病人范围后，自采若干例舌象数据，对采集的数据进行筛选，筛选后去除模糊和残缺图像，并对数据进行标注处理和格式转换，得到基于自采数据的自制数据集，后将数据集按照8:2的比例划分为训练集和验证集。

9、优选的，步骤二中，深度空间转换卷积作为网络的编码器首层结构，对输入的舌体特征图包含的颜色及纹理等浅层特征进行提取；将经典unet网络编码器的前三层卷积网络替换为swin-transformer，提出spd-swin-transformer的改进编码器结构，用于感知舌体特征图中包含的深层次语义信息。

10、优选的，通过将深度空间转换卷积提取的特征信息使用不同stride(卷积步长)的最大池化和不同rate(rate代表计算卷积时每两个像素之间的距离)的3×3卷积进行处理，并分别与前三层swin-transformer提取的信息通过1×1的普通卷积进行融合，作为后续跳跃连接的输入；

11、利用上述的方式将经典的编码器结构替换为swin-transformer和深度空间转换卷积级联的结构以及采用特征融合的方式处理跳跃连接的输入信息，完成对输入的特征图进行不同层级特征提取以及保留浅层特征图包含的特征信息。

12、优选的，步骤三中，在经典的unet网络结构的瓶颈层中加入一层ssaspp，使网络模型具有更大的感受野，增强网络捕捉深层次特征的能力，步骤三包括以下三个步骤：

13、基于一种分离共享卷积，对输入的有特征图进行处理，使后续的5组子采样特征图之间建立联系；

14、对5组子采样特征图分别通过1×1的普通卷积、3组膨胀倍率不同的3×3膨胀卷积和平均池化进行特征信息提取；

15、通过1×1的普通卷积对5组处理完的特征图进行融合，得到与输入特征图尺度相同的输出特征图。

16、优选的，步骤四中，在跳跃连接部分使用高效自适应多尺度注意力模块(eama)对输入的融合特征图进行处理。

17、优选的，步骤四中，对输入至跳跃连接层的特征图进行多层次特征提取，步骤四包括以下三个步骤：

18、将输入到其中的特征图按通道信息数量划分为多个子特征，并将每个子特征作为一个输入，通过三条平行路线来提取分组特征图的注意力权重描述符；两条平行路径在1×1分支上，在1×1分支中分别沿两个空间方向对通道进行编码，采用两个自适应平均池化操作对输入的特征信息进行处理；第三条路径为最大卷积分支，最大卷积是由两组包含深度可分离卷积、gelu(一种基于高斯误差函数的激活函数)和bn(批量归一化)，以及逐点卷积、gelu和bn的结构组成，最大卷积分支用以捕获多尺度特征表示。

19、优选的，两条1×1分支经由自适应平均池化处理后，通过1×1的卷积完成add操作，拼接完成的特征图通过sigmoid激活函数处理后与输入的另一组原始的子特征进行相加，1×1分支相加得到的特征图分别进行族归一化、自适应平均池化和sigmoid激活函数处理；最大卷积分支得到的特征图使用自适应平均池化和sigmoid激活函数处理，通过矩阵乘法函数matmul分别将最大卷积分支得到的特征图与1×1分支处理完成的特征图，以及1×1分支族归一化处理完成的特征图与最大卷积分支处理完成的特征图进行合并。

20、优选本文档来自技高网...

【技术保护点】

1.一种基于改进的UNet的舌体分割方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于改进的UNet的舌体分割方法，其特征在于：步骤一中，在确定设备、光线环境和病人范围后，自采若干例舌象数据，对采集的数据进行筛选，筛选后去除模糊和残缺图像，并对数据进行标注处理和格式转换，得到基于自采数据的自制数据集，后将数据集按照8:2的比例划分为训练集和验证集。

3.根据权利要求2所述的一种基于改进的UNet的舌体分割方法，其特征在于：步骤二中，将深度空间转换卷积作为网络的编码器首层结构，将经典UNet网络编码器的四层卷积网络替换为Swin-Transformer，利用上述的方式将经典的UNet网络编码器替换为所提出的SPD-Swin-Transformer级联结构。

4.根据权利要求3所述的一种基于改进的UNet的舌体分割方法，其特征在于：通过将深度空间转换卷积提取的浅层特征信息，使用不同卷积步长的最大池化和不同rate的3×3卷积进行处理，并分别与前三层Swin-Transformer提取的深层次特征信息通过1×1的普通卷积进行融合，融合

5.根据权利要求4所述的一种基于改进的UNet的舌体分割方法，其特征在于：步骤三中，在经典的UNet网络结构的瓶颈层中加入一层SSASPP，步骤三包括以下三个步骤：

6.根据权利要求5所述的一种基于改进的UNet的舌体分割方法，其特征在于：步骤四中，在跳跃连接部分使用高效自适应多尺度注意力模块EAMA对输入的融合特征图进行处理。

7.根据权利要求6所述的一种基于改进的UNet的舌体分割方法，其特征在于：步骤四中，对输入至跳跃连接层的特征图进行多层次特征提取，步骤四包括以下三个步骤：

8.根据权利要求7所述的一种基于改进的UNet的舌体分割方法，其特征在于：两条1×1分支经由自适应平均池化处理后，通过1×1的卷积完成add操作，拼接完成的特征图通过Sigmoid激活函数处理后与输入的另一组原始的子特征进行相加，1×1分支相加得到的特征图分别进行族归一化、自适应平均池化和Sigmoid激活函数处理；最大卷积分支得到的特征图使用自适应平均池化和Sigmoid激活函数处理，通过矩阵乘法函数matmul分别将最大卷积分支得到的特征图与1×1分支处理完成的特征图，以及1×1分支族归一化处理完成的特征图与最大卷积分支处理完成的特征图进行合并。

9.根据权利要求8所述的一种基于改进的UNet的舌体分割方法，其特征在于：两组合并完成的特征图通过add操作完成拼接，并经由Sigmoid激活函数处理，处理完成后与原始的子特征进行相加，通过重置权重操作后得到与原始输入尺度相同的输出特征图。

...

【技术特征摘要】

1.一种基于改进的unet的舌体分割方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于改进的unet的舌体分割方法，其特征在于：步骤一中，在确定设备、光线环境和病人范围后，自采若干例舌象数据，对采集的数据进行筛选，筛选后去除模糊和残缺图像，并对数据进行标注处理和格式转换，得到基于自采数据的自制数据集，后将数据集按照8:2的比例划分为训练集和验证集。

3.根据权利要求2所述的一种基于改进的unet的舌体分割方法，其特征在于：步骤二中，将深度空间转换卷积作为网络的编码器首层结构，将经典unet网络编码器的四层卷积网络替换为swin-transformer，利用上述的方式将经典的unet网络编码器替换为所提出的spd-swin-transformer级联结构。

4.根据权利要求3所述的一种基于改进的unet的舌体分割方法，其特征在于：通过将深度空间转换卷积提取的浅层特征信息，使用不同卷积步长的最大池化和不同rate的3×3卷积进行处理，并分别与前三层swin-transformer提取的深层次特征信息通过1×1的普通卷积进行融合，融合后的特征作为后续跳跃连接的输入。

5.根据权利要求4所述的一种基于改进的unet的舌体分割方法，其特征在于：步骤三中，在经典的unet网络结构的瓶颈层中加入一层ssaspp，步骤三包...

【专利技术属性】
技术研发人员：杨琦，张洋，孙思凡，方海亮，
申请(专利权)人：大连医科大学附属第二医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人