一种基于改进YOLOv3网络的眼底图像视盘检测方法技术

技术编号:37252311 阅读:10 留言:0更新日期:2023-04-20 23:30
本发明专利技术提出一种基于改进YOLOv3网络的眼底图像视盘检测方法,属于医学影像人工智能目标检测技术领域,包括以下步骤:缩减backbone网络并在缩减后的backbone网络中的每个残差块后面连接SENet模块;引入一个104

【技术实现步骤摘要】
一种基于改进YOLOv3网络的眼底图像视盘检测方法


[0001]本专利技术属于医学影像人工智能目标检测
,尤其涉及一种基于改进YOLOv3网络的眼底图像视盘检测方法。

技术介绍

[0002]数字眼底图像在医学研究以及临床诊疗中都起到非常重要的作用,它不仅可以用于诊断眼底疾病,还能为诊疗高血压、糖尿病、中风等全身性疾病提供参考依据。利用计算机视觉技术来测量眼底图像中的形态参数,能够客观、准确、迅速地为临床诊断提供更可靠的依据。在眼底图像辅助诊断系统中,视盘的各个参数是衡量眼底健康状况和病灶的重要指标,而视盘目标检测是实现辅助诊断和其他眼底结构识别的前提和关键步骤。
[0003]对于传统的视盘目标检测方法主要有三种,分别是:基于亮度、形状和面积特征的视盘检测、基于血管特征的视盘检测和基于多特征融合的视盘检测。但是,这三种方法分别存在对眼底图像灰度值的差值要求高、算法的复杂度高、特征提取时间较长等问题,这就导致眼底图像视盘检测效率低。
[0004]最近,深度学习在图像目标检测领域已经得到了广泛应用,尤其是YOLOv3网络性能优异。凭借深度学习强大的自学习能力,可以解决传统视盘检测效率低的问题。但是原YOLOv3网络是针对多类别的目标检测,所以它并不完全适配于眼底图像的视盘目标检测。当对数字眼底图像视盘目标检测时,原YOLOv3的backbone网络过于冗余复杂,这就增加了训练时间,减小检测速度;原YOLOv3中用于特征检测的特征金字塔网络(FeaturePyramidNetwork,FPN)是3尺度特征融合的,当对视盘目标检测时,由于尺度较少,所以对浅层特征信息利用较少。因此特征金字塔的表征能力较低,会出现部分误检和漏检现象。

技术实现思路

[0005]针对上述问题,本专利技术提供一种基于改进YOLOv3网络的眼底图像视盘检测方法。
[0006]一种基于改进YOLOv3网络的眼底图像视盘检测方法,包括以下步骤:
[0007]步骤1):获取眼底图像数据集,使用labelimg软件对眼底图像数据集进行视盘标注以及对标注后的数据集进行划分,得到训练集、验证集和测试集;
[0008]步骤2):缩减原YOLOv3网络中的backbone网络结构:将backbone网络中输出尺寸为52
×
52的残差块由原来的8块修改为4块;将backbone网络中输出尺寸为26
×
26的残差块由原来的8块修改为4块;将backbone网络中输出尺寸为13
×
13的残差块由原来的4块修改为2块;
[0009]步骤3):对缩减后的backbone网络导入注意力机制模块:在缩减后的backbone网络中的每个残差块后面连接SENet模块,所述SENet模块包括Squeeze部分和Excitation部分,Squeeze部分利用GlobalAveragePooling2D将H
×
W
×
C的特征信息压缩为1
×1×
C,Excitation部分将1
×1×
C的特征信息加入全连接层,对每个通道的重要性进行预测,得到
不同通道的重要性,最后将该重要性信息作用到初始H
×
W
×
C的特征信息上;
[0010]步骤4):改进原YOLOv3网络中特征金字塔的特征提取方法:引入一个104
×
104的检测尺度,将3尺度的检测网络修改成4尺度的检测网络,新增的104
×
104的检测尺度包括四个模块:第一个模块是连接模块,它将缩减后的backbone网络中通道数为128的残差块连接到多尺度融合特征检测网络上;第二个模块是卷积模块,卷积核的数量为64,尺度为1
×
1;第三个模块是上采样模块,利用双线性插值算法将上一层输出尺寸52
×
52扩大为104
×
104;第四个模块是张量融合模块,上采样模块的输出作为融合通道1,backbone网络低层104
×
104同等尺寸大小作为融合通道2,将两者进行通道拼接;
[0011]步骤5):利用k

means聚类算法生成先验框,采用边界框均方误差、置信度交叉熵和类别交叉熵的总和作为损失函数;
[0012]步骤6):将训练集输入改进后的YOLOv3网络,利用梯度下降法优化网络模型参数,得到训练好的网络模型;
[0013]步骤7):用训练好的网络模型对眼底图像进行视盘目标检测,预测视盘的位置信息。
[0014]本专利技术由于采用了以上方法,具有以下优点:
[0015]1.通过对原YOLOv3网络中的backbone网络的缩减,减少残差块的数量,减小backbone网络复杂度,在充分提取图像特征信息的前提下,减少训练时间,增加检测速度;
[0016]2.导入注意力机制(Squeeze

and

ExcitationNetworks,SENet)模块,利用SENet模块去学习眼底图像中重点要处理的部分,从而减少需要处理的像素数量,进而降低了检测任务的复杂度;
[0017]3.改进后的多尺度目标检测网络充分融合多尺度的浅层特征信息,增强了特征金字塔的表征能力,提高了视盘的目标检测精度,降低了漏检率;
[0018]4.相比于现有的基于深度学习的眼底视盘检测算法,本专利技术具有较高的检测精度和速度,能够辅助眼底医学诊断。
附图说明
[0019]图1为本专利技术所述一种基于改进YOLOv3网络的眼底图像视盘检测方法的流程图;
[0020]图2为缩减后的backbone网络的结构示意图;
[0021]图3为导入SENet模块后的backbone网络的结构示意图;
[0022]图4为4尺度特征利用的目标检测网络的结构示意图;
[0023]图5为改进后的YOLOv3网络的结构示意图;
[0024]图6为眼底图像视盘检测的效果图。
具体实施方式
[0025]为了加深对本专利技术的理解,下面将结合附图和实例对本专利技术做进一步详细描述,该实例仅为本分明其中的一个应用实例,并不对本专利技术的保护范围构成限定。
[0026]如图1所示,本专利技术提供一种基于改进YOLOv3网络的眼底图像视盘检测方法,包括以下步骤:
[0027]步骤1):获取眼底图像数据集,使用labelimg软件对眼底图像数据集进行视盘标
注以及对标注后的数据集进行划分,得到训练集、验证集和测试集。
[0028]获取MESSIDOR数据集的1058张眼底图像,使用labelimg软件对眼底图像进行视盘标注,按照7:1:2的比例分为训练集740张、验证集106张和测试集212张。
[0029]步骤2):缩减原YOLOv3网络中的backbone网络结构:具体地,将backbone网络中输出尺寸为52本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv3网络的眼底图像视盘检测方法,其特征在于,包括以下步骤:步骤1):获取眼底图像数据集,使用labelimg软件对眼底图像数据集进行视盘标注以及对标注后的数据集进行划分,得到训练集、验证集和测试集;步骤2):缩减原YOLOv3网络中的backbone网络结构:将backbone网络中输出尺寸为52
×
52的残差块由原来的8块修改为4块;将backbone网络中输出尺寸为26
×
26的残差块由原来的8块修改为4块;将backbone网络中输出尺寸为13
×
13的残差块由原来的4块修改为2块;步骤3):对缩减后的backbone网络导入注意力机制模块:在缩减后的backbone网络中的每个残差块后面连接SENet模块,所述SENet模块包括Squeeze部分和Excitation部分,Squeeze部分利用GlobalAveragePooling2D将H
×
W
×
C的特征信息压缩为1
×1×
C,Excitation部分将1
×1×
C的特征信息加入全连接层,对每个通道的重要性进行预测,得到不同通道的重要性,最后将该重要性信息作用到初始H
×
W
×
C的特征信息上;步骤4):改进原YOLOv3网络中特征金字塔的特征提取方法:引入一个104
×
104的检测尺度,将3尺度的检测网络修改成4尺度的检测网络,新增的104
×
104的检测尺度包括四个模块:第一个模块是连接模块,它将缩减后的backbone网络中通道数为128的残差块连接到多尺度融合特征检测网络上;第二个模块是卷积模块,卷积核的数量为64,尺度为1
×
1;第三个模块是上采样模块,利用双线性插值算法将上一层输出尺寸52
×

【专利技术属性】
技术研发人员:徐伟陶淑苹刘帅李宗轩
申请(专利权)人:中国科学院长春光学精密机械与物理研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1