当前位置: 首页 > 专利查询>深圳大学专利>正文

基于注意力引导金字塔上下文网络的大肠息肉分割方法技术

技术编号:36256490 阅读:15 留言:0更新日期:2023-01-07 09:52
本发明专利技术公开一种基于注意力引导金字塔上下文网络的大肠息肉分割方法,包括:数据集获取:根据公开的息肉分割数据集中的内窥镜图像划分训练集和测试集;网络搭建:提取多层具有不同空间分辨率的特征图,并进行采样以获取各层的采样结果,提取各层的特征图的上下文特征,通过注意力引导多层聚合策略探索各层的串联特征,获取各层的初步预测图,并聚合获取最终预测图;网络监督:采用损失函数分别对采样结果、初步预测图及最终预测图进行深监督学习;网络训练:将训练集输入至网络模型进行训练,获取对应的初步预测图并计算其对应的息肉区域分布概率图,采用损失函数结合预存的真实分割图计算误差,记录网络性能达到最佳时的参数的权重;网络测试。网络测试。网络测试。

【技术实现步骤摘要】
基于注意力引导金字塔上下文网络的大肠息肉分割方法


[0001]本专利技术涉及医学图像处理
,尤其涉及一种基于注意力引导金字塔上下文网络的大肠息肉分割方法。

技术介绍

[0002]近年来,结直肠癌(CRC)对公共健康产生了严重威胁。根据美国癌症协会的一份研究报告显示,CRC在所有癌症中发病率中位居第三,CRC的发病率和死亡率急剧增长,随着病情的加重,大肠癌患者的生存率急剧下降。在临床工作中,结直肠癌的早期筛查对大肠癌预防至关重要,能够及时诊断和去除CRC的早期病灶(例如息肉)对于提高患者生存率具有重要意义。
[0003]在临床上,内窥镜检查是息肉筛查的主要方法,通过内窥镜检查,医生可以清楚地观察整个结肠的长度,并移除可能转化为CRC的息肉。但是,即便是一个有丰富经验的医生进行的视觉上的息肉检查,其工作量繁重且带有一定主观性,仍有可能会导致高达25%的漏检率,而漏诊的息肉可诱发为晚期CRC,导致其存活率低于10%。因此,临床上急切需要设计自动、可靠的计算机辅助诊断方法来准确定位结肠镜图像中的息肉,减少大肠息肉的漏检率,帮助医生做出正确的决策,提高患者的生存率。
[0004]过去的几十年中,深度卷积神经网络(CNN)由于其强大的目标相关特征提取和集成能力,在医学图像分割中显示出巨大的潜力。大多数基于CNN的分割方法主要遵循编码器

解码器框架,以端到端的方式完成分割任务。在编码器阶段,通过特征提取单元获得低层空间细节和高层语义概念来提取目标特征。在解码器阶段,从编码器获得的特征生成预测掩码。一般而言,现有的基于CNN的分割方法可以根据其应用范围大致分为两类,即通用型方法和专用型方法。通用方法通常关注多个分割任务的共同特征,从不同方面进行相应处理。虽然通用型方法在同时处理多个分割任务时具有明显的优势,并且具有相当的鲁棒性,但它们不可避免地忽略了每个分割任务的特定特征,并且通常在某些任务上实现了中等的性能。相反,专用型方法被用于处理息肉分割任务。这些方法的共性就是在网络设计中充分考虑息肉的具体特征,且具有自动息肉感知特征提取和集成的优势,在息肉分割任务中取得了较好的效果。
[0005]现有的息肉分割方法存在以下问题:息肉在临床中表现的特征形状和大小差别很大,且形状边缘不规则的特性;大肠粘膜与息肉边界的颜色特征较为接近,使得息肉和周围背景难以区分。上述问题导致现有的息肉自动分割算法的精度不够高,甚至会存在息肉漏检。

技术实现思路

[0006]本专利技术所要解决的技术问题是提供一种基于注意力引导金字塔上下文网络的大肠息肉分割方法以精确识别息肉,降低息肉漏检风险。
[0007]为解决上述技术问题,本专利技术的目的是通过以下技术方案实现的:提供一种基于
注意力引导金字塔上下文网络的大肠息肉分割方法,包括以下步骤:数据集获取:根据公开的息肉分割数据集中的内窥镜图像划分训练集和测试集;网络搭建:提取多层具有不同空间分辨率的特征图,对各层提取的特征图进行采样,获取各层的采样结果,提取各层的特征图的上下文特征,通过注意力引导多层聚合策略探索各层的串联特征,获取各层的初步预测图,聚合各层的初步预测图,获取最终预测图;网络监督:采用损失函数分别对各层的采样结果、各层的初步预测图及最终输出的最终预测图进行深监督学习;网络训练:将训练集中的各样本依次输入至基于注意力引导金字塔上下文网络模型进行训练,根据获得的各样本的各层的初步预测图采用Softmax函数计算获取各样本的息肉区域分布概率图,采用损失函数结合各样本的息肉区域分布概率图及预存的标注好的真实分割图计算误差损失,调整参数,记录网络性能达到最佳时的参数的权重;网络测试:对测试集中的各样本进行裁剪,以将测试图像统一裁剪为352
×
352的尺寸,对裁剪后的测试图像采用记录的网络性能达到最佳时的参数的权重进行测试,获取裁剪后的测试图像的各层的初步预测图并根据其采用Softmax函数计算获取测试图像的息肉区域分布概率图,结合预设概率阈值,于裁剪后的测试图像中划分息肉区域及背景区域,获得分割图像。
[0008]本专利技术的有益技术效果在于:本专利技术基于注意力引导金字塔上下文网络的大肠息肉分割方法通过根据公开的息肉分割数据集的内窥镜图像划分训练集和测试集,提取多层特征图,采用上下文提取模块获取各层的上下文特征,利用注意力引导的多层聚合策略通过根据不同层的互补信息细化各层的上下文特征,以探索各层的串联特征,实现从粗到细的息肉分割,提高息肉识别的精确度,降低息肉漏检风险;同时,采用损失函数对中间隐藏层及最终输出层进行深监督学习,以采用分级监督的方式提高后续网络训练的效率。
附图说明
[0009]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的流程示意图;
[0011]图2为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的第一子流程示意图;
[0012]图3为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的第二子流程示意图;
[0013]图4为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的第三子流程示意图;
[0014]图5为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的第四子流程示意图;
[0015]图6为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的第五子流程示意图;
[0016]图7为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的基于注意力引导金字塔上下文网络模型的框架结构示意图;
[0017]图8为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的上下文特征提取模块的结构示意图;
[0018]图9为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的多层聚合模块的结构示意图;
[0019]图10为本专利技术实施例提供的基于注意力引导金字塔上下文网络的大肠息肉分割方法的注意力模块的结构示意图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0022]还应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力引导金字塔上下文网络的大肠息肉分割方法,其特征在于,包括以下步骤:数据集获取:根据公开的息肉分割数据集中的内窥镜图像划分训练集和测试集;网络搭建:提取多层具有不同空间分辨率的特征图,对各层提取的特征图进行采样,获取各层的采样结果,提取各层的特征图的上下文特征,通过注意力引导多层聚合策略探索各层的串联特征,获取各层的初步预测图,聚合各层的初步预测图,获取最终预测图;网络监督:采用损失函数分别对各层的采样结果、各层的初步预测图及最终输出的最终预测图进行深监督学习;网络训练:将训练集中的各样本依次输入至基于注意力引导金字塔上下文网络模型进行训练,根据获得的各样本的各层的初步预测图采用Softmax函数计算获取各样本的息肉区域分布概率图,采用损失函数结合各样本的息肉区域分布概率图及预存的标注好的真实分割图计算误差损失,调整参数,记录网络性能达到最佳时的参数的权重;网络测试:对测试集中的各样本进行裁剪,以将测试图像统一裁剪为352
×
352的尺寸,对裁剪后的测试图像采用记录的网络性能达到最佳时的参数的权重进行测试,获取裁剪后的测试图像的各层的初步预测图并根据其采用Softmax函数计算获取测试图像的息肉区域分布概率图,结合预设概率阈值,于裁剪后的测试图像中划分息肉区域及背景区域,获得分割图像。2.根据权利要求1所述的基于注意力引导金字塔上下文网络的大肠息肉分割方法,其特征在于,所述数据集获取的步骤后还包括:尺寸裁剪:统一将所有内窥镜图像裁剪至352
×
352的尺寸。3.根据权利要求1所述的基于注意力引导金字塔上下文网络的大肠息肉分割方法,其特征在于,所述网络搭建的步骤具体包括:特征编码:采用ResNet50提取第一层至第五层的具有不同空间分辨率的特征图;特征处理采样:对第二层至第四层生成的特征映射分别采用CBR模块进行处理,以将第二层至第四层的通道数均降为256,并提取第二层至第四层的通道数为256的特征图;采用空洞空间卷积池化金字塔模块于第五层中提取通道数为256的特征图并获取其多尺度语义信息;对获得的第二层至第五层中通道数为256的对应的特征图进行采样,获取各层的采样结果;上下文特征提取:将各层的采样结果作为各层的待提取特征映射,采用上下文特征提取模块对各层的待提取特征映射进行提取操作,保留各层的待提取特征映射的局部信息并压缩各层的待提取特征映射的全局信息,捕获各层的待提取特征映射的上下文特征作为各层的映射图;串联特征探索:将各层的采样结果通过金字塔结构连接,获取组合采样特征,根据获得的组合采样特征及各层的映射图通过注意力引导多层聚合策略(AMAS)探索各层的串联特征;预测图获取:将各层的串联特征从高层到低层逐层沿梯度方向相加,获取各层的梯度串联特征,对各层的梯度串联特征分别采用CBR模块进行处理,获取各层的初步预测图,聚合各层的初步预测图,生成并输出最终预测图。4.根据权利要求3所述的基于注意力引导金字塔上下文网络的大肠息肉分割方法,其
特征在于,所述特征处理采样的步骤及所述预测图获取的步骤中的所述CBR模块包括一内核尺寸为3
×
3的卷积层运算单元、一批量归一化单元和一ReLU激活函数单元。5.根据权利要求3所述的基于注意力引导金字塔上下文网络的大肠息肉分割方法,其特征在于,所述上下文特征提取的步骤中...

【专利技术属性】
技术研发人员:周天薇谭松柏李思莹牛奔
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1