一种基于注意力机制的息肉图像分割方法技术

技术编号:38340311 阅读:10 留言:0更新日期:2023-08-02 09:20
本发明专利技术公开一种基于注意力机制的息肉图像分割网络,其特点是采用级联部分解码器聚合息肉高级特征生成息肉全局特征图和息肉分割结果图,同时基于注意力机制构造息肉语义增强模块,重新整合通道维度与空间维度的息肉语义信息,增强有效语义信息的流动,进而增强退化的息肉语义信息。本发明专利技术具体步骤包括:数据集的预处理、基于注意力机制的息肉图像分割网络模型的构建、基于注意力机制的息肉图像分割网络模型的训练与测试。相较于现有技术,本发明专利技术同时注意到息肉特征提取过程中小息肉的位置语义和边缘模糊息肉的边界语义退化的问题,提高了网络模型对于小目标息肉和边缘模糊息肉的分割能力,实现息肉图像的自动分割,具有良好的应用前景。好的应用前景。好的应用前景。

【技术实现步骤摘要】
一种基于注意力机制的息肉图像分割方法


[0001]本专利技术属于大数据深度学习领域中的医学图像分割
,具体设计一种基于注意力机制的息肉图像分割方法。

技术介绍

[0002]早期结肠镜检查有助于医生在结直肠息肉发展为结直肠癌之前采取应对措施,使结直肠癌发病率下降30%。基于结肠镜检查的息肉检测工作高度依赖于医生的经验水平,存在较高的漏检率。运用深度学习理论与计算机相关技术,设计自动准确的息肉分割方法辅助医生检出息肉并确定息肉区域具有重要的研究意义与应用价值。
[0003]两个原因使得自动息肉分割成为一项具有挑战性的任务:不同息肉的大小、颜色和纹理具有多样性;部分息肉组织与周围正常组织外观差别较小。其中,小目标息肉与边缘模糊息肉是息肉分割的难点。传统的自动息肉分割方法依赖于手工提取的特征(颜色、形状和纹理等)对图像进行处理与分割,由于手工提取的特征表征能力有限,传统方法具有较高的漏检率。近年来,深度学习技术在息肉分割任务中取得了较好的结果,成为息肉分割方法研究的新趋势。基于深度学习的息肉分割方法使用深度学习编码器自动提取息肉图像的语义特征,使用解码器还原图像细节并完成图像分割任务。基于深度学习的息肉分割编码器在提取图像特征过程中,特征下采样的频繁操作导致图像分辨率大幅下降,这不仅会造成小息肉的位置语义信息退化,而且会造成边缘模糊息肉的边界语义信息退化。然而,现有息肉分割方法很少同时考虑到小息肉的位置语义信息和边缘模糊息肉的边界语义信息退化的问题,这导致了现有息肉分割方法对模糊小息肉分割效果较差的问题。现有息肉分割算法对模糊小息肉不正确的分割结果可能会误导医师对息肉的判断,这阻碍了自动的息肉分割方法的实际应用。

技术实现思路

[0004]本专利技术的目的是针对现有技术的不足而提出的一种基于注意力机制的息肉图像分割方法。该方法采用级联部分解码器聚合息肉高级特征以提取多尺度息肉信息并生成息肉全局特征图和息肉分割结果图。该方法基于注意力机制构造息肉语义增强模块,重新整合通道维度与空间维度的息肉语义信息,增强有效息肉语义信息的流动,进而增强退化的小息肉的位置语义信息和退化的边缘模糊息肉的边界语义信息。本专利技术可以有效检出结肠镜图像中的息肉组织,尤其是边缘模糊的小息肉,提高了息肉分割的准确率。本专利技术在复杂息肉分割条件下也可达到较好的分割效果和泛化性能,具有较好的应用前景。
[0005]实现本专利技术的具体技术方案是:一种基于注意力机制的息肉图像分割方法,具体包括下述步骤:
[0006]步骤1,数据集的预处理。
[0007]准备公开的息肉图像数据集,将息肉图像分为训练集、验证集和测试集,用于息肉分割网络的训练和测试。
[0008]步骤2,一种基于注意力机制的息肉图像分割方法的网络模型的构建。
[0009]一种基于注意力机制的息肉图像分割方法的网络整体设计为编码器

解码器架构,编码器选取ResNet50作为骨干网络提取5个层级的息肉特征,其中3

5级息肉特征为高级特征。本专利技术网络的具体结构为:首先,使用第一个级联部分解码器聚合富含语义信息的息肉高级特征,得到息肉全局特征图;其次,将息肉全局特征图输入构造的息肉语义增强模块,重新整合息肉全局特征图中通道维度与空间维度的息肉语义信息,增强有效息肉语义信息的流动,得到增强后的息肉全局特征图;然后,将增强后的息肉全局特征图输入ResNet50后三个阶段,得到新的息肉高级特征;最后,使用第二个级联部分解码器聚合新的息肉高级特征,得到息肉分割结果图。
[0010]本专利技术构造的息肉语义增强模块由息肉通道语义增强模块和息肉空间语义增强模块组成。息肉通道语义增强模块基于通道注意力实现,能够基于通道注意力细化并重新整合有效的息肉语义信息。息肉空间语义增强模块基于空间注意力实现,能够基于空间注意力重新校准息肉语义特征,并学习使用全局信息来增强有效的息肉语义信息并抑制无用的信息。息肉语义增强模块有机地结合了通道注意力和空间注意力,通过注意力机制增强了有效信息的流动并抑制了无效信息的流动,可解决编码器特征提取过程中的边缘模糊息肉边缘语义信息和小息肉位置语义信息退化的问题,提高本专利技术提出的一种基于注意力机制的息肉图像分割方法对息肉目标小与息肉边缘模糊两种情况的分割能力,进而提升本专利技术提出方法的息肉分割精度。
[0011]步骤3,一种基于注意力机制的息肉图像方法的网络的训练与测试。
[0012]使用经过步骤1的训练数据集对步骤2中所构造的网络结构进行训练,训练过程中基于网络模型对验证集息肉图片的分割效果调整超参数和损失函数,并使用多尺度训练策略。训练网络模型时,保存在验证数据集上效果最好的模型,并使用保存的模型对测试集图像进行分割以得到息肉分割结果,最后使用合适的指标验证分割结果的准确性。
[0013]与现有技术相比,本专利技术具有如下优点:
[0014]1)提出了一种基于注意力机制的息肉分割方法。该方法使用级联部分解码器聚合高级特征以提取多尺度息肉信息并生成息肉全局特征图与息肉分割结果图,使用构造的息肉语义增强模块增强退化的息肉语义信息以提高该方法的息肉分割精度。
[0015]2)提出了息肉语义增强模块。该模块结合了通道注意力与空间注意力,能够重新整合通道维度与空间维度的息肉语义信息,增强有效息肉语义信息的流动,进而解决编码器网络特征提取过程中由于下采样的频繁操作造成的小息肉位置语义与边缘模糊息肉边界语义信息的退化问题,提高息肉分割精度。
附图说明
[0016]下面结合附图与实施例对本专利技术进一步说明,附图中:
[0017]图1是本专利技术构建的网络模型的整体结构示意图;
[0018]图2是本专利技术构造的息肉语义增强模块的结构示意图;
[0019]图3是本专利技术使用的级联部分解码器的结构示意图;
[0020]图4是本专利技术提出的网络与其他网络的息肉分割效果定性比较示意图。
具体实施方式
[0021]本专利技术提供一种基于注意力机制的息肉图像分割方法,下面结合附图和实施例对本专利技术的技术方案作进一步说明。
[0022]本专利技术实施例的流程包括以下步骤:
[0023]步骤1,数据集的预处理。
[0024]收集四个公开的息肉图像数据集,分别为:Kvasir,CVC

ClinicDB,CVC

ColonDB和CVC

T。数据集的划分方式为:使用Kvasir中的900张图片与CVC

ClinicDB中的550张图片共1450张图片组成训练集用于网络模型的训练和验证,训练集和验证集的比例为8:1;使用Kvasir中不参与模型训练的100张图片、CVC

ClinicDB中不参与模型训练的62张图片、CVT

T中的60张图片和CVC

ColonDB中的380张图片共602张图片组成测试集用于CSENet方法测试。训练集用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的息肉图像分割方法,其特征在于:所述基于注意力机制的息肉图像分割网络整体为编码器

解码器架构,编码器选取ResNet50作为骨干网络提取5个层级的息肉特征,其中3

5级息肉特征为高级特征;首先,使用第一个级联部分解码器聚合富含语义信息的息肉高级特征,得到息肉全局特征图;其次,将息肉全局特征图输入构造的息肉语义增强模块,重新整合息肉全局特征图中通道维度与空间维度的息肉语义信息,得到增强后的息肉全局特征图;然后,将增强后的息肉全局特征图输入ResN...

【专利技术属性】
技术研发人员:林绵端邵帅广田薰戴亚平
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1