当前位置: 首页 > 专利查询>汕头大学专利>正文

一种基于深度神经网络的图像分类方法技术

技术编号:33274624 阅读:15 留言:0更新日期:2022-04-30 23:32
本发明专利技术公开了一种基于深度神经网络的图像分类方法,包括:建立二级分类体系,将需要辨识图像细节的类别放到同一个大类中,将只和图像某一个局部区域有关的类别放到同一个大类中,其他的病种或者病变分别放到一个个大类中。输入一张视网膜眼底图像,首先使用普通分辨率模型去分大类,然后对于需要辨识图像细节的大类使用大分辨率模型分子类,对于只和图像一个小的局部区域有关的大类,首先定位、裁剪该局部区域,然后使用小分辨率的模型区分子类。本发明专利技术相较于传统分类方法能够明显提高分类准确率。本发明专利技术相较于传统分类方法能够明显提高分类准确率。提高分类准确率。提高分类准确率。

【技术实现步骤摘要】
一种基于深度神经网络的图像分类方法


[0001]本专利技术属于人工智能深度学习和计算机视觉领域,特别是涉及一种基于深度神经网络的图像分类方法。

技术介绍

[0002]图像分类应用极为广泛,是计算机视觉要解决的最基本问题,并且目标检测、语义分割、实例分割等其他问题的解决也都依赖于图像分类。深度神经网络技术首先在图像分类上获得突破,之后获得了巨大进展,网络结构从AlexNet到VGG、ResNet再到最新的SE

Net、NASNet,分类方法有二分类、多分类(Multi

Classes)、多标签分类(Multi

labels)等不同的分类方式,并且整合了图像预处理、数据增强、多模型集成、同一张图像经过不同的处理(例如随机裁剪)多次输入神经网络然后对预测结果进行集成等技术,分类准确率越来越高。基于神经网络进行图像分类方法不仅在ImageNet等竞赛中的准确率已经超过了人类,在大多数现实应用场景下也取得了非常好的效果。
[0003]当前图像分类针对同一个分类问题都是采用同样输入分辨率的深度神经网络模型,虽然在绝大多数场景下这样做毫无问题,在某些场景下效果会非常差,这些场景指的是不同类别中有些类别是根据图像的整体特征,有些类别只和图像的微小细节有关,而有些类别只和图像的很小的一个局部有关。
[0004]类似于特征金字塔FPN(feature pyramid networks)的方法在一个深度神经网络内能够融合不同层次的特征,这些特征既包括低层特征:位置准确但是整体特征语义信息很少,以及高层特征:语义信息比较丰富,但是目标位置比较粗略。特征金字塔的方法在目标检测等取得了很好的效果,但是不能解决上述复杂的分类场景下,不同的类别之间特征层次差别巨大的问题。因此,只使用同样输入分辨率的深度神经网络模型无法兼顾辨识图像的整体特征、局部特征和细节特征。特征金字塔等融合多尺度特征的网络结构,不能解决复杂的分类场景下,不同的类别之间特征层次差别巨大的问题。
[0005]以视网膜眼底图像的分类为例,也就是输入眼底图像,输出该图像是正常或者某种病变。这些类别中有些类别是和图像的整体特征有关,例如豹纹、视网膜色素变性等。而有些类别需要辨识图像的微小细节,例如糖尿病视网膜病变(Diabetic Retinopathy 简称DR)的DR1(DR国际标准分为五级DR1

DR5),其特征是存在微血管瘤,微血管瘤在图像上表现为小红点,即使在原始图像上也只有若干个像素大小。而有些类别只和原图像中的一个很小区域有关,例如青光眼和视神经萎缩只和视盘内部以及视盘周边区域有关,黄斑水肿只和黄斑区域有关等。
[0006]针对以上问题,如果使用同样分辨率的深度神经网络区分所有类别的话,模型的分辨率必须非常大(例如512*512),这样才可能辨识微血管瘤等细节,才可能比较好的区分类别DR1。一方面使用大模型对于诊断DR1是必须的,但是另一方面对于其他类别来说使用大模型反而带来坏处:包括更多的模型参数,更长的训练和预测时间,特别是因为大模型更容易产生过拟合,造成分类准确率反而降低。
[0007]从理论上,根据原始图像使用普通的深度神经网络模型来区分只和图像某一个小局部相关的类别(例如青光眼和视神经萎缩)是完全可行的,但是在实际中往往行不通。原因在于深度神经网络是根据训练样本去学习自动提取特征,由于真正的特征集中在原图的一个很小区域内,原图中的其他区域具有大量的无关特征,因此必须有大量的训练样本才可能教会深度神经网络提取到正确的特征,而现实中往往很难获得所需要的大量训练样本,例如在医疗影像领域,获得标注好的医疗影像成本很高,对于许多病种(例如罕见病)甚至是不可能的。

技术实现思路

[0008]为解决上述问题,本专利技术提供了如下方案:一种基于深度神经网络的图像分类方法,包括:建立图像分类的二级分类体系,将眼底图像输入所述二级分类体系进行图像分类获得分类结果;根据所述分类结果判断图像是否正常。
[0009]优选地,建立所述二级分类体系包括,将需要辨识图像微小细节的类别划分为第一大类,基于所述第一大类再区分子类;将只和图像某一个局部相关的类别划分为第二大类,基于所述第二大类再区分子类;将其他病种或者特征类型放到其他大类中。
[0010]优选地,将眼底图像输入所述二级分类体系之前还包括,构建深度神经网络模型;所述深度神经网络模型包括普通分辨率模型、大分辨率模型、小分辨率模型;其中,所述大分辨率模型的输入大于普通分辨率模型的1.4倍,所述小分辨率模型的输入小于普通分辨率模型的0.7倍。
[0011]优选地,将所述眼底图像输入所述二级分类体系进行图像分类包括,通过所述普通分辨率模型分大类;针对第一大类再通过所述大分辨率模型分子类,针对第二大类首先进行定位、裁剪小局部区域然后用所述小分辨率模型去划分子类。
[0012]优选地,获得所述分类结果包括获得第一分类结果;获得所述第一分类结果包括,通过所述普通分辨率模型将所述眼底图像根据辨识图像情况划分为第一大类、第二大类、其他大类;所述第一大类为需要辨识所述图像的微小细节;所述第二大类为需要辨识所述图像和原图像的局部区域有关。
[0013]优选地,获得所述分类结果包括获得第二分类结果;获得所述第二分类结果包括,针对第一大类的分类结果,通过大分辨率模型划分所述第一大类的下属子类;针对第二大类的分类结果,将所述眼底图像中定位、裁剪出分类的相关区域,通过小分辨率模型划分所述第二大类的下属子类。
[0014]本专利技术公开了以下技术效果:本专利技术提供的一种基于深度神经网络的图像分类方法,通过构建用于图像分类的设置分类层次结构关系的初始神经网络模型,对采集视网膜的眼底图像进行图像分类;根据分类结果判断图像是正常或者某种病变。该方法针对有些类别是根据图像的整体特征,有些类别只和图像的微小细节有关,有些类别只和图像的某个很小的局部有关这样的场景,相比传统方法能够明显提高分类准确率。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本专利技术实施例的方法流程图;图2为本专利技术实施例的自定义大模型Resnet的网络结构图;图3为本专利技术实施例的自定义小模型Resnet的网络结构图。
具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的图像分类方法,其特征在于,包括:建立图像分类的二级分类体系,将眼底图像输入所述二级分类体系进行图像分类获得分类结果;根据所述分类结果判断图像是否正常。2.根据权利要求1所述的基于深度神经网络的图像分类方法,其特征在于,建立所述二级分类体系包括,将需要辨识图像微小细节的类别划分为第一大类,基于所述第一大类再区分子类;将只和图像某一个局部相关的类别划分为第二大类,基于所述第二大类再区分子类;将其他病种或者特征类型放到其他大类中。3.根据权利要求2所述的基于深度神经网络的图像分类方法,其特征在于,将眼底图像输入所述二级分类体系之前还包括,构建深度神经网络模型;所述深度神经网络模型包括普通分辨率模型、大分辨率模型、小分辨率模型;其中,所述大分辨率模型的输入大于普通分辨率模型的1.4倍,所述小分辨率模型的输入小于普通分辨率模型的0.7倍。4.根据权利要求3所述的基于深度神经网络的图像分类方法,其特征在于,将所...

【专利技术属性】
技术研发人员:吉杰张铭志岑令平林建伟邱坤良
申请(专利权)人:汕头大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1