一种基于数据增强与模型融合的病理性近视识别方法技术

技术编号:27879735 阅读:121 留言:0更新日期:2021-03-31 01:11
本发明专利技术公开一种基于数据增强与模型融合的病理性近视识别方法,首先对待识别的眼底图片进行算法操作以提升数据质量,然后将眼底图像送入深度学习模型进行识别,输出识别结果;所述深度学习模型包括一级模型和次级模型,一级模型的输出接入硬投票器模型作为分类器构成次级模型框架;将一级模型输出作为次级模型的输入;在次级模型中统计每条样本中预测结果项中出现的众数,作为最终的识别结果。此种方法基于多种经典卷积神经网络自动识别眼底图像,同时采用模型融合策略与多种数据增强方式建立模型,从而解决小样本下模型训练不完备情况、避免过拟合以及提高模型泛化效果,一定程度上提高模型的表达能力和泛化能力。

【技术实现步骤摘要】
一种基于数据增强与模型融合的病理性近视识别方法
本专利技术属于图像处理
,涉及人工智能技术在医学影像领域的应用,特别涉及一种基于数据增强与模型融合的病理性近视识别方法。
技术介绍
病理性近视(pathologicalmyopia,PM)是指屈光度多在-8.00D以上。近视度数持续加深,且常伴发眼后极部的变形改变,包括巩膜变薄、脉络膜萎缩变薄及眼轴的增长,可伴有弱视、青光眼、白内障、玻璃体混浊、视网膜脱落等多种并发症的眼病。病理性近视相关并发症是现今人们视觉损害及失明的主要原因之一,这种情况在东亚地区尤为严峻。病理性近视可以引起黄斑、视网膜外周以及视神经的多种病变,从而导致视觉损害。眼球结构畸形、包括后巩膜葡萄肿,会加速这些病的进展。有关病理性近视的流行病学调查很多,尽管它们在对病理性近视的定义上可能有所不同。在亚洲人群中的调查显示,病理性近视的发病率为0.9%~3.1%;对澳洲人群的调查显示,病理性近视的发病率为1.2%。此外,研究显示,病理性近视已经成为7%的欧洲人口失明及视力低下的首要原因。由于环境因素和生活方式的变化,高度近视及病理性近视的发病率还在逐年上升。因此,在未来的几十年中,病理性近视相关并发症造成的视力损害问题很可能会变得更为严峻。我国眼科医师数量与发达国家相比差距甚大,但国内医患需求本就巨大且近年来随着社会老龄化的发展,其数量呈现逐年递增的趋势。当前医疗领域的主要矛盾是人民日益增长的医疗需求同日趋紧张的医疗资源之间的矛盾。一方面,“看病难、看病贵”的问题仍然存在,主要是现有优秀的医师人才严重稀缺以及医生培养时间长造成;另一方面,人们的健康问题逐渐恶化,对健康的重视程度高,医疗服务需求增加。这是一个社会难题,但人工智能技术却有可能为医疗行业带来转机。在过去的20年间,借助光学相干断层扫描术、频域OCT和三维磁共振成像术等影像学技术的发展,我们对高度近视相关并发症有了更深度的认知。例如,应用OCT,我们能以高分辨率评估视神经、黄斑以及新近的病变,如近视性牵拉性黄斑病变和圆顶状黄斑病变等。新的治疗手段、包括抗新生血管药物疗法和玻璃体切割术等的出现还使部分高度近视相关并发症的预后得到了改善。近年来,随着深度学习的发展,其在不同领域的实践和应用已逐渐开展,医学领域也不例外,基于机器学习的人工智能技术在眼科中的应用便是其中之一。许多眼部疾病的诊断很大程度上依赖于眼科辅助检查结果,而大部分眼科辅助检查都以影像学检查为主。眼部图像精细、复杂、信息量大,诊断结果常受限于医生的知识水平与临床经验,主观性较强,耗时耗力。通过与计算机相结合的机器学习的人工智能技术在眼科中的应用,可以极大地提高临床工作中眼科疾病的诊断效率,减轻了眼科医生的负担。以数据驱动,自动提取相关特征的卷积神经网络(CNN)在图像识别方面比传统方法有更好的效果,例如FCN(fullyconvolutionalnetworks)等,因此把深度学习相关技术引入到医学影像处理当中是一种自然的选择,利用卷积神经网络来进行视盘识别的研究也越来越多,并取得了优于识别方法的识别结果。虽然基于卷积神经网络的眼底图像识别方法在一定程度上优于传统方法的效果,但是仍然存在一些问题,例如:医学影像数据量大但样本少,但模型训练过程中最主要的依赖便是数据集,数据集的质量决定着模型的质量,因此对数据的预处理可以有效的提升模型的训练效果。又比如,随着深度学习在图像识别领域的不断发展,优秀的神经网络模型不断被提出,虽然每种模型都具有独特的优势,但无法保证在处理各种数据时都表现优异,这就会导致模型的表达能力可能存在短板,即在某些罕见病变图片的识别中显得疲软。针对以上两种已有问题,业界也有很多研究者在不同角度提出优化后的神经网络模型,并取得了行之有效的结果。但通过对已有模型进行改进的方法仍然存在很多不可控因素,例如研究者在优化模型时(比如加宽加深模型),不能直接判断其有效性,只能通过训练结果来观察优化的操作是否对原模型的性能进行有效提升。这样的方法对于算力和时间方面的需求巨大,研发周期较长,通常不能快速解决问题,且其真实适用性有待商榷。
技术实现思路
本专利技术的目的,在于提供一种基于数据增强与模型融合的病理性近视识别方法,基于多种经典卷积神经网络自动识别眼底图像,同时采用模型融合策略与多种数据增强方式建立新的深度卷积神经网络模型,以此优化小样本下模型训练不完备、过拟合等情况,且该方式可以在一定程度上提高模型泛化效果,表达能力以及模型识别图片的精确性,为病理性近视的识别以及预后研究提出新的思路。为了达成上述目的,本专利技术的解决方案是:一种基于数据增强与模型融合的病理性近视识别方法,包括如下步骤:步骤1,获取待识别的眼底图像;步骤2,将待识别的眼底图像送入深度学习模型进行识别,输出识别结果;其中,深度学习模型的训练方法是:步骤a,确定数据集,并将数据集按照7:2:1的比例划分训练集、验证集和测试集;步骤b,对训练集的数据采用多种数据增强方式进行数据增强,得到相对应的增强后的数据集;步骤c,将步骤b增强后的数据集分别送入AlexNet、GooLeNet、VGG-16、ResNet-50进行训练,并以各网络在验证集上的验证准确率来衡量各种数据增强方式在该网络上的学习质量,保存各网络在验证数据集上对应准确率最高的网络模型并记录其对应的数据增强策略,将此时的AlexNet、GooLeNet、VGG-16、ResNet-50作为深度学习模型的一级模型;步骤d,记录一级模型在验证集上的所有识别结果,作为二级模型,即硬投票模型的输入数据集,通过众数选择的方式对一级模型的识别结果做出再次判断,并得到最终的识别结果。上述步骤2中,所有一级模型均在学习率0.001,损失函数采用logisticloss损失函数,优化器采用SSD优化器,batch_size全部设置为10,每个epoch是30个batch,每个模型均进行30个epoch训练,并且保存,作为一级模型;冻结以上所有模型的卷积层,全连接层,BN层以及其他层,将输出层接入硬投票模型,进而构建成为结果融合后的深度学习模型。上述步骤b中,对数据集进行数据增强,具体包括如下内容:①对图片进行随机翻转;②对数据集添加随机高斯白噪声;③对数据添加随机亮度,饱和度,对比度;④对图片进行随机等比例裁剪;⑤对图片进行随机改变清晰度;⑥对图片进行随机拉伸;⑦在原始数据集上叠加随机旋转,随机白噪声以及随机色彩的变化;⑧在原始数据集上叠加堆积裁剪和拉伸操作操作;⑨在原始数据集上叠加随机翻转,随机白噪声,随机亮度,饱和度,对比度,添加随机拉伸,以及随机清晰度;⑩在原始数据集上叠加随机翻转和随机改变清晰度;在原始数据集上叠加随机裁剪,随机水平翻转以及高斯模糊;在原始数据集上叠加以上所有方法。上述步骤b中,还对数据增强后的数据集进行预处理,包括对数据首先进本文档来自技高网
...

【技术保护点】
1.一种基于数据增强与模型融合的病理性近视识别方法,其特征在于包括如下步骤:/n步骤1,获取待识别的眼底图像;/n步骤2,将待识别的眼底图像送入深度学习模型进行识别,输出识别结果;/n其中,深度学习模型的训练方法是:/n步骤a,确定数据集,并将数据集按照7:2:1的比例划分训练集、验证集和测试集;/n步骤b,对训练集的数据采用多种数据增强方式进行数据增强,得到相对应的增强后的数据集;/n步骤c,将步骤b增强后的数据集分别送入AlexNet、GooLeNet、VGG-16、ResNet-50进行训练,并以各网络在验证集上的验证准确率来衡量各种数据增强方式在该网络上的学习质量,保存各网络在验证数据集上对应准确率最高的网络模型并记录其对应的数据增强策略,将此时的AlexNet、GooLeNet、VGG-16、ResNet-50作为深度学习模型的一级模型;/n步骤d,记录一级模型在验证集上的所有识别结果,作为二级模型,即硬投票模型的输入数据集,通过众数选择的方式对一级模型的识别结果做出再次判断,并得到最终的识别结果。/n

【技术特征摘要】
1.一种基于数据增强与模型融合的病理性近视识别方法,其特征在于包括如下步骤:
步骤1,获取待识别的眼底图像;
步骤2,将待识别的眼底图像送入深度学习模型进行识别,输出识别结果;
其中,深度学习模型的训练方法是:
步骤a,确定数据集,并将数据集按照7:2:1的比例划分训练集、验证集和测试集;
步骤b,对训练集的数据采用多种数据增强方式进行数据增强,得到相对应的增强后的数据集;
步骤c,将步骤b增强后的数据集分别送入AlexNet、GooLeNet、VGG-16、ResNet-50进行训练,并以各网络在验证集上的验证准确率来衡量各种数据增强方式在该网络上的学习质量,保存各网络在验证数据集上对应准确率最高的网络模型并记录其对应的数据增强策略,将此时的AlexNet、GooLeNet、VGG-16、ResNet-50作为深度学习模型的一级模型;
步骤d,记录一级模型在验证集上的所有识别结果,作为二级模型,即硬投票模型的输入数据集,通过众数选择的方式对一级模型的识别结果做出再次判断,并得到最终的识别结果。


2.如权利要求1所述的基于数据增强与模型融合的病理性近视识别方法,其特征在于:所述步骤2中,所有一级模型均在学习率0.001,损失函数采用logisticloss损失函数,优化器采用SSD优化器,batch_size全部设置为10,每个epoch是30个batch,每个模型均进行30个epoch训练,并且保存,作为一级模型;
冻结以上所有模型的卷积层,全连接层,BN层以及其他层,将输出层接入硬投票模型,进而构建成为结果融合后的深度学习模型。


3.如权利要求3所述的基于数据增强与模型融合的病理性近视识别方法,其特征在于:所述步骤b中,对数据集进行数据增强,具体包括如下内容:
①对图...

【专利技术属性】
技术研发人员:张晓云崔建峰黄建玉吴万庆熊飞兵韦程琳蒋明哲陈浩徐飞翔刘琳
申请(专利权)人:厦门理工学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1