当前位置: 首页 > 专利查询>苏州大学专利>正文

一种基于改进Faster R-CNN的黄斑定位方法技术

技术编号:20427583 阅读:45 留言:0更新日期:2019-02-23 09:20
本发明专利技术公开一种基于改进Faster R‑CNN的黄斑定位方法,包括采集训练样本、构建网络模型、训练网络模型、构建检测模型和黄斑检测与定位。本发明专利技术利用改进的Faster R‑CNN对于黄斑区域的有效定位,降低了视盘、血管对黄斑区域的影响,而且抗噪声干扰能力强,大大提高了黄斑区域的准确定位,对于眼底图像的后续分析和处理奠定了基础。

【技术实现步骤摘要】
一种基于改进FasterR-CNN的黄斑定位方法
本专利技术属于视网膜图像处理与分析方法
,尤其是对视网膜眼底彩照图像目标区域的定位,具体涉及一种基于改进FasterR-CNN的黄斑定位方法。
技术介绍
眼底彩照技术在已经广泛应用于眼底相关疾病的临床检查中,并受到越来越多的关注与重视。例如:糖尿病性黄斑水肿(diabeticmacularedema,DME),是糖尿病患者失明的主要原因,老年性黄斑变性(Age-relatedmaculardegeneration,AMD)是成年人失明的主要原因,中心性浆液性脉络膜视网膜病变(centralserouschorioretinopathy,CSC)是大多数青壮年男性产生眼病的主要原因。因此早期的疾病检查对疾病的预防和治疗至关重要。这些黄斑疾病如果没有及时的发现和治疗都会导致永久性失明,因此早期发现病灶,跟踪病情发展尤为重要,其中准确的黄斑定位是这一过程中的关键步骤。黄斑处于人眼的光学中心区,颜色偏暗、反光较弱,很容易受到干扰,黄斑定位算法通常依赖于形态学特征和位置约束。目前的黄斑定位算法主要有以下几种缺陷:(1)十分依赖视盘和血管的信息,受视盘和血管检测正确率的影响,存在一定的应用局限性;(2)由于利用了形态学特征,因此传统的一些方法通常很容易受到噪声的干扰,当黄斑区域发生较大形变或者拍摄效果不好时,现有的算法将失效。
技术实现思路
针对现有技术的不足,本专利技术提供了一种基于改进FasterR-CNN的黄斑定位方法,利用改进的FasterR-CNN对于黄斑区域的有效定位,降低了视盘、血管对黄斑区域的影响,而且抗噪声干扰能力强,大大提高了黄斑区域的准确定位,对于眼底图像的后续分析和处理奠定了基础。本专利技术是通过以下技术方案予以实现的:一种基于改进FasterR-CNN的黄斑定位方法,包括以下步骤:S1、采集训练样本:从Kaggle数据集中获取眼底图像,对获取的眼底图像进行黄斑区域标记,并将标记好的图像制作成VOC2007数据集的格式,构建训练样本集;S2、构建网络模型:构建CNN特征提取网络、级联区域建议网络、上下文网络和判别网络,其中,所述CNN特征提取网络采用ResNet残差网络,包括卷积层、残差块、激励函数和池化层;所述级联区域建议网络由2个区域建议网络级联形成,包括卷积层,Softmax分类层,bbox层;所述上下文网络包括残差块、池化层、全连接层、Softmax层和bbox层;所述判别网络包括池化层、全连接层、激励函数层、Softmax层和bbox层构成;S3、训练网络模型:初始化所述的特征提取网络、区域建议网络、上下文网络和判别网络,然后,通过输入已标记黄斑区域的图像对所述特征提取网络进行训练,得到ResNet特征提取网络模型;所述区域建议网络利用所述ResNet特征提取网络模型输出的特征图进行训练,得到级联区域建议网络模型;所述级联区域建议网络模型输出的区域建议边框映射到特征提取网络输出的特征图的相应区域,对该区域进行池化并送入所述上下文网络进行训练,得到上下文网络模型;所述判别网络根据所述上下文网络模型提供的候选区域进行判别,得到判别网络模型;S4、构建检测模型:将所述的ResNet特征提取网络模型、级联区域建议网络模型、上下文网络模型和判别网络模型组合成改进后的FasterR-CNN检测网络,利用训练样本集中的训练数据对所述改进后的FasterR-CNN检测网络进行训练,训练50次,得到黄斑区域检测和定位网络模型;S5、黄斑检测与定位:利用所述黄斑区域检测和定位网络模型对待检测的眼底图像进行黄斑区域检测和定位,得到眼底图像黄斑区域的候选框,调整候选框阈值,采用非极大值抑制,得到最终的候选框。优选地,所述CNN特征提取网络采用ResNet中的残差块加上Inception-v3多尺度结构作为特征提取网络。优选地,构建网络模型的步骤中,所述卷积层采用两个尺度的卷积核。优选地,所述两个尺度的卷积核包括:3*3卷积核和1*1卷积核。优选地,训练网络模型的步骤进一步包括:训练模型分两步,第一步联合训练特征提取网络和区域建议网络,得到提取预选框的模型,其中特征提取网络是由ResNet网络进行的特征提取;第二步,利用由提取预选框模型预测出来的边框映射到特征提取网络输出特征图的相应区域,进行感兴趣区域池化,然后再训练特征提取网络以及上下文网络和判别网络。优选地,在区域建议网络的训练过程中,为每一个锚点参考框分配一个二进制标签,将与金标准框的交并比(Intersection-over-Union;IoU)大于0.7的锚点参考框贴上正标签,将与金标准框的IoU小于0.3的锚点参考框贴上负标签,将处于二者之间的既不积极又不消极的锚点参考框直接丢弃。优选地,在检测阶段,当候选框的交并比与金标准框的重叠度大于0.5时,认为所述候选框是一个真实的候选者。优选地,所述方法采用误检率、漏检率和准确率这三个指标来评价黄斑定位结果,并计算如下:其中FP为误检个数,FN为漏检个数,ALL为全部的眼底图像,FPR为误检率,MR为漏检率,ACC为准确率。与现有技术相比,本专利技术的有益效果在于,1)本专利技术首次提供了一种具有可行性和有效性的基于改进的FasterR-CNN对于黄斑的准确定位,包括:①采用ResNet中的残差块加上Inception-v3多尺度结构代替原有的FasterR-CNN里的VGG-16网络作为特征提取网络,在特征提取时,不仅可以合适的获取目标,而且可以降低参数和计算的冗余,同时避免由于网络的加深而出现的梯度消失、梯度爆炸以及过拟合的问题;②将区域建议网络(RegionProposalNetworks;RPN)进行了级联,形成了级联区域建议网络(CascadedRegionProposalNetworks;CRPN)代替原有的RPN结构,改善了浅层细节对于候选框的影响;③在得到候选框之后,加入上下文网络,使得在对黄斑进行定位时,既考虑了黄斑区域的形态学信息,又考虑了黄斑区域对于整个眼底的相对位置信息,提高了黄斑定位的有效性;2)本专利技术首次将深度学习方法应用于黄斑定位,利用改进的FasterR-CNN对于黄斑区域的有效定位,降低了视盘、血管对黄斑区域的影响,而且抗噪声干扰能力强,大大提高了黄斑区域的准确定位,对于眼底图像的后续分析和处理奠定了基础。附图说明图1为根据实施例的本专利技术方法的网络模型的结构示意图;图2为根据实施例的本专利技术中特征提取网络的结构示意图;图3为根据实施例的本专利技术中标准RPN的示意图;图4为根据实施例的本专利技术中级联RPN的示意图;图5为根据实施例的本专利技术中上下文网络的结构示意图;图6(a)至图6(f)为根据实施例的本专利技术中黄斑定位结果的示意图。具体实施方式以下将结合附图对本专利技术各实施例的技术方案进行清楚、完整的描述,显然,所描述发实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本专利技术所保护的范围。本专利技术提供一种基于改进FasterR-CNN的黄斑定位方法,包括以下步骤:S1、采集训练样本:从Kaggle数据集中获取眼底图像,对获取的眼底图像进行本文档来自技高网...

【技术保护点】
1.一种基于改进Faster R‑CNN的黄斑定位方法,其特征在于,包括以下步骤:S1、采集训练样本:从Kaggle数据集中获取眼底图像,对获取的眼底图像进行黄斑区域标记,并将标记好的图像制作成VOC2007数据集的格式,构建训练样本集;S2、构建网络模型:构建CNN特征提取网络、级联区域建议网络、上下文网络和判别网络,其中,所述CNN特征提取网络采用ResNet残差网络,包括卷积层、残差块、激励函数和池化层;所述级联区域建议网络由2个区域建议网络级联形成,包括卷积层,Softmax分类层,bbox层;所述上下文网络包括残差块、池化层、全连接层、Softmax层和bbox层;所述判别网络包括池化层、全连接层、激励函数层、Softmax层和bbox层构成;S3、训练网络模型:初始化所述的特征提取网络、区域建议网络、上下文网络和判别网络,然后,通过输入已标记黄斑区域的图像对所述特征提取网络进行训练,得到ResNet特征提取网络模型;所述区域建议网络利用所述ResNet特征提取网络模型输出的特征图进行训练,得到级联区域建议网络模型;所述级联区域建议网络模型输出的区域建议边框映射到特征提取网络输出的特征图的相应区域,对该区域进行池化并送入所述上下文网络进行训练,得到上下文网络模型;所述判别网络根据所述上下文网络模型提供的候选区域进行判别,得到判别网络模型;S4、构建检测模型:将所述的ResNet特征提取网络模型、级联区域建议网络模型、上下文网络模型和判别网络模型组合成改进后的Faster R‑CNN检测网络,利用训练样本集中的训练数据对所述改进后的Faster R‑CNN检测网络进行训练,训练50次,得到黄斑区域检测和定位网络模型;S5、黄斑检测与定位:利用所述黄斑区域检测和定位网络模型对待检测的眼底图像进行黄斑区域检测和定位,得到眼底图像黄斑区域的候选框,调整候选框阈值,采用非极大值抑制,得到最终的候选框。...

【技术特征摘要】
1.一种基于改进FasterR-CNN的黄斑定位方法,其特征在于,包括以下步骤:S1、采集训练样本:从Kaggle数据集中获取眼底图像,对获取的眼底图像进行黄斑区域标记,并将标记好的图像制作成VOC2007数据集的格式,构建训练样本集;S2、构建网络模型:构建CNN特征提取网络、级联区域建议网络、上下文网络和判别网络,其中,所述CNN特征提取网络采用ResNet残差网络,包括卷积层、残差块、激励函数和池化层;所述级联区域建议网络由2个区域建议网络级联形成,包括卷积层,Softmax分类层,bbox层;所述上下文网络包括残差块、池化层、全连接层、Softmax层和bbox层;所述判别网络包括池化层、全连接层、激励函数层、Softmax层和bbox层构成;S3、训练网络模型:初始化所述的特征提取网络、区域建议网络、上下文网络和判别网络,然后,通过输入已标记黄斑区域的图像对所述特征提取网络进行训练,得到ResNet特征提取网络模型;所述区域建议网络利用所述ResNet特征提取网络模型输出的特征图进行训练,得到级联区域建议网络模型;所述级联区域建议网络模型输出的区域建议边框映射到特征提取网络输出的特征图的相应区域,对该区域进行池化并送入所述上下文网络进行训练,得到上下文网络模型;所述判别网络根据所述上下文网络模型提供的候选区域进行判别,得到判别网络模型;S4、构建检测模型:将所述的ResNet特征提取网络模型、级联区域建议网络模型、上下文网络模型和判别网络模型组合成改进后的FasterR-CNN检测网络,利用训练样本集中的训练数据对所述改进后的FasterR-CNN检测网络进行训练,训练50次,得到黄斑区域检测和定位网络模型;S5、黄斑检测与定位:利用所述黄斑区域检测和定位网络模型对待检测的眼底图像进行黄斑区域检测和定位,得到眼底图像黄斑区域的候选框,调整候选框阈值,采用非极大值抑制,得到最终的候选框。2....

【专利技术属性】
技术研发人员:陈新建黄旭东朱伟芳
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1