一种基于GACNN的多标签眼底图像识别方法技术

技术编号:28376305 阅读:25 留言:0更新日期:2021-05-08 00:03
本发明专利技术涉及图像处理技术领域,特别涉及一种基于GACNN的多标签眼底图像识别方法,包括获取原始眼底图像,并将进行预处理;构建GACNN模型,并利用经过预处理的带标签原始眼底图像进行训练,GACNN模型包括卷积神经网络、图注意网络和融合层,卷积神经网络用于提取图像特征;图注意网络用于对眼底多标签之间的关系进行建模,将眼底图像的各个标签看做一组相互依赖的节点,利用历史数据进行训练得到多标签分类器;融合层将卷积神经网络和图注意力网络得到的特征进行融合,得到最后的分类结果;将待检测的原始眼底图像输入训练好的GACNN模型,输出带标签的识别结果;本发明专利技术对眼底图像中的多标签进行识别时充分考虑到标签之间的相关性,且提高了眼底图像的识别准确性。

【技术实现步骤摘要】
一种基于GACNN的多标签眼底图像识别方法
本专利技术涉及图像处理
,特别涉及一种基于GACNN(图注意卷积神经网络)的多标签眼底图像识别方法。
技术介绍
眼底图像是眼科医生诊疗眼底疾病的主要依据,眼底图像处理有着极高的意义。由于高度近视人群在不断的增长且高度近视可能会导致眼底病变的发生从而失明,这就给眼科医生的筛查带来了极大的压力,利用计算机技术来处理眼底图像能有效的帮助医生缓解这种压力。在眼底图像识别的研究中通常有基于传统图像处理的方法以及基于深度学习的方法。在基于传统图像处理的分类方法上需要人为的设计特征并且处理图像,但是在近视性眼底疾病的图像中通常有多种疾病共存,不同疾病的特征表达交织在一起,人为设计特征来识别疾病是十分困难的。随着深度学习技术在图像处理领域取得的重大突破,越来越多的研究采用深度学习技术来处理眼底图像。利用深度学习技术就可以避免人为设计特征带来的误差,只需要将眼底图像与相应的眼底疾病的标签进行对应,并将其制成数据集输入卷积神经网络模型中训练模型,最终可以得到一个模型来进行近视性眼底疾病诊断。r>利用深度学习技术本文档来自技高网...

【技术保护点】
1.一种基于GACNN的多标签眼底图像识别方法,其特征在于,具体包括以下步骤:/n获取原始眼底图像,并将进行预处理;/n构建GACNN模型,并利用经过预处理的带标签原始眼底图像进行训练;/n将待检测的原始眼底图像输入训练好的GACNN模型,输出带标签的识别结果。/n

【技术特征摘要】
1.一种基于GACNN的多标签眼底图像识别方法,其特征在于,具体包括以下步骤:
获取原始眼底图像,并将进行预处理;
构建GACNN模型,并利用经过预处理的带标签原始眼底图像进行训练;
将待检测的原始眼底图像输入训练好的GACNN模型,输出带标签的识别结果。


2.根据权利要求1所述的一种基于GACNN的多标签眼底图像识别方法,其特征在于,对获取的原始眼底图像进行预处理包括:
对原始眼底图片进行归一化处理,将所有图片处理为224×224像素的图片;
利用利用直方图均衡化对原始眼底图片进行图像增强处理,突出原始眼底图片中眼底视盘和血管。


3.根据权利要求1所述的一种基于GACNN的多标签眼底图像识别方法,其特征在于,GACNN模型包括卷积神经网络、图注意网络和融合层,卷积神经网络用于提取图像特征;图注意网络用于对眼底多标签之间的关系进行建模,将眼底图像的各个标签看做一组相互依赖的节点,利用历史数据进行训练得到多标签分类器;融合层将卷积神经网络和图注意力网络得到的特征进行融合,得到最后的分类结果。


4.根据权利要求3所述的一种基于GACNN的多标签眼底图像识别方法,其特征在于,卷积神经网络包括5个卷积块,卷积块之间通过一个最大池化层进行连接,在每个卷积块经过最大池化到下一个卷积块之前,先将该卷积块得到的featuremaps进行全局最大池化的操作得到一个特征向量,将每个卷积块得到的特征向量进行拼接,得到图像特征。


5.根据权利要求3所述的一种基于GACNN的多标签眼底图像识别方法,其特征在于,图注意网络包括多层图注意层,根据图注意网络训练得到获取多标签分类器的过程包括:
将眼底标签的特征表示成一个F维的词嵌入向量,将各个节点的词嵌入向量组合起来,作为图注意层的输入;
在图注意层中通过固定大小的共享矩阵对输入该层的特征进行线性变换,并利用自我注意机制作用于节点,计算每个节点之间的相关系数;
使用SoftMax函数对当前节点的所有邻接点的注意力系数进行归一化,得到注意力系数;
根据得到的注意力系数更新当...

【专利技术属性】
技术研发人员:胡敏朱润笋黄宏程
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1