【技术实现步骤摘要】
基于双线性池化与注意力机制的细粒度眼底图像分级算法
本专利技术属于智能医学影像处理领域,涉及一种基于双线性池化与注意力机制的细粒度眼底图像分级算法。
技术介绍
深度学习是机器学习和人工智能研究的最新趋势之一。它也是当今最流行的科学研究趋势之一。深度学习方法为计算机视觉和机器学习领域带来了革命性的进步。近年来,深度学习方法在医学影像处理中得到了广泛的关注。对于一些特定的任务,深度学习方法已经显示出可以与医学专家相匹敌或超越医学专家的表现。在眼底图像中,可以观测到视网膜病变病灶有微动脉瘤、出血、硬渗出物、棉絮状渗出点和新生血管。根据眼底病变严重程度可将糖尿病视网膜病变分为正常、轻微、中等、严重、增生五个等级。眼底图像病灶种类繁多,患病等级划分标准复杂。有时相邻等级的眼底图像病灶相似,同一等级眼底图像病灶差异很大(见图1),人工判别病变分级往往是不准确且困难的。大部分只能通过医生的估算,并且费时费力。如何高效精准的对视网膜病变进行分级是眼底图像分析领域中一个重要挑战。在视网膜病变分级中,存在严重的样本不均衡问题。在 ...
【技术保护点】
1.一种基于双线性池化与注意力机制的细粒度眼底图像分级算法,其特征在于所述细粒度眼底图像分级算法包括如下步骤:/n步骤一、获取数据集/n下载来自Kaggle’s Diabetic Retinopathy Detection Challenge数据集;/n步骤二、数据集预处理/n使用Opencv将步骤一中获取到的图像尺寸调整为512×512,将数据集中的过度曝光图像进行去噪处理,并对图像的无用部分进行裁切,使最终得到的图像均包含实验有用信息;/n步骤三、搭建非同源卷积神经网络/n使用ResNet50和DenseNet121搭建非同源卷积神经网络用于双线性池化;/n步骤四、引入 ...
【技术特征摘要】
1.一种基于双线性池化与注意力机制的细粒度眼底图像分级算法,其特征在于所述细粒度眼底图像分级算法包括如下步骤:
步骤一、获取数据集
下载来自Kaggle’sDiabeticRetinopathyDetectionChallenge数据集;
步骤二、数据集预处理
使用Opencv将步骤一中获取到的图像尺寸调整为512×512,将数据集中的过度曝光图像进行去噪处理,并对图像的无用部分进行裁切,使最终得到的图像均包含实验有用信息;
步骤三、搭建非同源卷积神经网络
使用ResNet50和DenseNet121搭建非同源卷积神经网络用于双线性池化;
步骤四、引入注意力机制模块
(1)对输入特征图进行全局平均池化:
其中,H和W是特征图的高和宽,x(i,j)表示特征图的每个像素,ν为注意力机制的输出;
(2)将得到的特征向量经过两个全连接层和激活函数处理:
y=F(v,W)=δ(W2σ(W1v));
其中,W1和W2表示全连接层的权重,v是全局平均池化后得到的特征向量,σ表示ReLU激活函数,δ表示Sigmoid激活函数;
(3)将特征向量y逐通道与输入特征图x相乘,得到的注意力特征图即为输出特征图;
步骤五、选择损失函数
使用补充交叉熵损失函数来计算网络的反向传播损失;
步骤六、训练神经网络
使用Pytorch对搭建的网络模型进行训练;
步骤七、生成预测文件
针对测试集,生成预测的csv文件,进行指标测试。
2.根据权利要求1所...
【专利技术属性】
技术研发人员:刘萍萍,金百鑫,杨晓康,周求湛,
申请(专利权)人:吉林大学,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。