一种视网膜OCT图像分类装置制造方法及图纸

技术编号：37817937 阅读：8 留言：0更新日期：2023-06-09 09:49

本发明专利技术公开了一种视网膜OCT图像分类装置，包括数据增强模块、图像分类模块，其中：数据增强模块用于调整输入的原始图像大小，扩充图像数据，得到数据增强的图像数据集，并将图像数据集输入图像分类模块；图像分类模块能根据所述图像数据集构建基于自注意力机制的分类模型，对视网膜OCT图像进行分类并输出图像分类结果；本发明专利技术能够实现获得更广泛的感受野，且分类模型不存在下采样操作，能够完整地聚焦于核心分类信息；能够适应各种数据增强方式，伴随更灵活的数据增强方式能够使得本发明专利技术的泛化性能更为突出，从而提高本发明专利技术识别视网膜OCT图像的整体准确率。膜OCT图像的整体准确率。膜OCT图像的整体准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种视网膜OCT图像分类装置

[0001]本专利技术涉及视网膜OCT图像识别的
，特别是涉及一种视网膜OCT图像分类装置。

技术介绍

[0002]随着社会、经济不断地进步与发展，人们用眼时压力剧增，视网膜病变患者数量不断增加。临床眼科医生面临较大的诊断压力，视网膜光学相干断层扫描(Optical Coherence Tomography，OCT)图像智能识别技术可以有效提高诊断效率、缓解医生诊断压力。
[0003]目前视网膜病变眼底图像一般是通过OCT技术
[1]获取。该技术具有无创、高分辨率等特点，是目前眼科最为先进的成像技术。
[0004]视网膜OCT图像识别技术面临的挑战主要集中在如下几个方面：
[0005]一、数据资源小而分散。
[0006]二、模型在小型数据上很难取得优秀的表现，而大型数据集训练的模型迁移至小型数据集时容易出现不收敛的问题。
[0007]三、数据格式不统一。
[0008]有关深度学习对OCT图像进行智能的识别研究中，基于卷积神经网络的深度学习模型取得了不错的效果，但由于其需要较大的数据集进行模型训练，在中小型数据集上直接训练的结果往往不佳，虽然通过保留在大型数据集的预训练参数可以在一定程度上改善模型在小型数据集上的性能表现，但其性能表现仍然存在一定的提升空间。在对视网膜OCT图像进行分类时，由牛津大学视觉几何组(Visual GeometryGroup，VGG)提出的VGG16
[2]卷积神经网络得到了广泛的应用，也取得了...

【技术保护点】

【技术特征摘要】
1.一种视网膜OCT图像分类装置，其特征在于，包括数据增强模块、图像分类模块，其中：所述数据增强模块用于调整输入的原始图像大小，扩充图像数据，得到数据增强的图像数据集，并将图像数据集输入图像分类模块；所述图像分类模块能根据所述图像数据集构建基于自注意力机制的分类模型，对视网膜OCT图像进行分类并输出图像分类结果。2.根据权利要求1所述的视网膜OCT图像分类装置，其特征在于，所述数据增强模块将原始图像随机裁剪得到不同的大小和宽高比的图像，再将得到的图像缩放裁剪至固定大小，然后以概率p＝0.3～0.5进行水平翻转，最后将图像转化为RGB格式的图像数据集。3.根据权利要求1所述的视网膜OCT图像分类装置，其特征在于，所述图像分类模块构建的分类模型为基于自注意力机制的Vision Transformer模型，所述VisionTransformer模型包括嵌入层、Transformer编码器、全连接层。4.根据权利要求3所述的视网膜OCT图像分类装置，其特征在于，所述嵌入层将输入的图像数据集切分成小图像块，使用卷积核对每个小图像块进行卷积运算得到特征层，再将每个通道的特征展平为一维向量，得到第一向量组。5...

【专利技术属性】
技术研发人员：董宇涵，李树祥，江学锋，李志德，张凯，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人