眼底图像分类方法、装置及计算机可读存储介质制造方法及图纸

技术编号:22330721 阅读:25 留言:0更新日期:2019-10-19 12:23
本发明专利技术实施例提供一种眼底图像分类方法、装置及计算机可读存储介质,包括:获得眼底图像、以及所述眼底图像中所包括的对象的类别;调整所述眼底图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;基于调整后的眼底图像和新图像构造的训练集、以及所包括对象的类别,训练神经网络模型;基于训练后的所述神经网络模型,判断待预测眼底图像中所包括对象的类别。

【技术实现步骤摘要】
眼底图像分类方法、装置及计算机可读存储介质
本专利技术涉及图像处理技术,特别涉及一种眼底图像分类方法、装置及计算机可读存储介质。
技术介绍
随着多媒体技术与计算机设备网络的广泛应用,网络上出现大量图像数据。如何能够有效的管理这些图像文件,自动识别和分类这些图像的内容变的越来越重要。目前,随着机器学习方法的不断完善和发展,深度学习算法越来越受到重视,其中卷积神经网络就是深度学习中一种重要的算法,目前已成为图像识别领域的研究热点。基于卷积神经网络的图像分类技术能够自动从图像中提取特征信息,通过提取的特征进行图像表达。然而,针对不同具体领域或者不同类别的图像,基于卷积神经网络进行分类时,往往需要分别建立与该领域或者类别对应的网络模型,每个网络模型包含的层级与整体架构通过训练的方式进行确定,而为了获取更好的特征表达能力以取得更好的分类精度,尤其是针对分类精度要求更高的领域,往往需要针对同一领域或类别的图像分别获得更多相同或者同类的原始图像数据作为训练数据,以增加网络深度、扩大网络规模,通过更多训练数据来将网络模型的各个层级的架构分别基于前一层级的架构确定后再进行搭建,从而网络模型训练方式复杂,且训练得到的网络模型对图像的分类精度不够稳定。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种训练方式简单、且可提高分类精度稳定性的眼底图像分类方法、装置及计算机可读存储介质。本专利技术实施例的技术方案是这样实现的:一种眼底图像分类方法,包括:获得眼底图像、以及所述眼底图像中所包括的眼球的类别;调整所述眼底图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;基于调整后的眼底图像和新图像构造的训练集、以及所包括眼球的类别,训练神经网络模型;基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,所述类别为以下之一:正常、温和非增值性、中度非增值性、重度非增值性及增值性。一种眼底图像分类装置,包括:获取模块,用于获得眼底图像、以及所述眼底图像中所包括的眼球的类别;调整模块,用于调整所述眼底图像的显示参数满足取值条件;变换模块,用于根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;训练模块,用于基于调整后的眼底图像和新图像构造的训练集、以及所包括眼球的类别,训练神经网络模型;预测模块,用于基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,所述类别为以下之一:正常、温和非增值性、中度非增值性、重度非增值性及增值性。一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本专利技术实施例所提供的眼底图像分类方法。本专利技术实施例中,通过获取眼底图像、以及所述眼底图像中所包括的眼球的类别,调整眼底图像的显示参数满足取值条件并获得调整后的眼底图像,根据显示参数的分布需要满足的分布条件,对眼底图像的显示参数进行变换获得新图像,获取的新图像的数量可以通过显示参数的分布需要满足的分布条件而进行调整,从而可以基于调整后的眼底图像和新图像,构造更多有效的用于训练神经网络模型的训练集,针对同一领域或类别的眼底图像的数量较少的情况下也能够获得稳定的分类精度;基于调整后的眼底图像和新图像构造的训练集、以及所包括眼球的类别,训练神经网络模型是可以已知的神经网络模型为基础进行训练,通过训练更新神经网络模型的权重,得到训练后的神经网络模型进行预测,从而训练方式更加简单。附图说明图1为本专利技术一实施例中图像分类方法的应用场景示意图;图2为本专利技术一实施例中图像分类方法的流程图;图3为本专利技术一实施例中BP神经网络的神经元模型示意图;图4为本专利技术一实施例中BP神经网络模型的示意图;图5为本专利技术一实施例中卷积神经网络的卷积层操作示意图;图6为本专利技术一实施例中卷积神经网络的池化层示意图;图7为本专利技术一具体实施例中图像分类方法的流程图;图8为本专利技术另一具体实施例中图像分类方法的流程图;图9为图8所示实施例中神经网络模型的结构示意图;图10为本专利技术一实施例中图像分类装置的硬件结构示意图;图11为本专利技术另一实施例中图像分类装置的结构示意图。具体实施方式以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。对本专利技术进行进一步详细说明之前,对本专利技术实施例中涉及的名词和术语进行说明,本专利技术实施例中涉及的名词和术语适用于如下的解释。1)对象,本文中指用于进行分类的对象,如人和物体等。2)样本图像,即包括有对象的成像的图像,例如JPEG等各种数字格式的图像。3)图像锐化(也称为图像增强),通过各种手段提升样本图像中对象的成像特性,扩大样本图像中对象的成像区域与其他区域的区别度。4)损失函数(lossfunction)也叫代价函数(costfunction),是神经网络优化的目标函数。5)神经网络(NeuralNetworks,NN),是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。本专利技术实施例提供图像分类方法、实施图像分类方法的图像分类装置、以及存储用于实现图像分类方法的可执行程序的存储介质。就图像分类方法的实施而言,本专利技术实施例提供终端侧和服务器侧实施的方案,将对图像分类的示例性实施场景进行说明。如图1所示,为实现本专利技术实施例提供的图像分类方法的图像分类应用对待预测图像在服务器进行类别判断的一个可选的应用场景示意图,用户通过在终端中安装图像分类应用客户端,于图像分类应用中输入待预测图像,可以获得服务器对该待预测图像进行特征提取、类别判断后的分类结果。其中,图像分类应用可以是针对不同图像所包含的对象,通过神经网络训练确定神经网络模型,从而得到的分别针对不同图像所包含的对象进行识别以确定类别的图像分类应用。以图像所包含的对象为人脸为例,图像分类应用是指针对待预测图像中所包含的人脸的预设部位(眼睛或其它部位)或者整体特征(组成脸部的全部特征)进行识别以确定类别的图像分类应用。类别是指针对对应的对象进行分类的维度,该分类的维度可以是对象在外观上所呈现的外在特性,以眼部为例,如丹凤眼、三角眼等;也可以是对象的外观所隐含的内在特性,仍以眼部为例,如性格、年龄、疾病等。以原始图像为眼部图像、原始图像中所包含的对象为眼睛、以及对象的类别为丹凤眼、三角眼、柳叶眼、狐狸眼和杏眼五种类别为例,用户在终端中安装图像分类应用客户端,图像分类应用中输入待预测眼部图像,服务器获取该待预测眼部图像,提取该待预测眼部图像中眼睛的形状特征,根据提取的形状特征与训练神经网络模型时进行类别确定时对应的形状特征的相似度,从而确定该待预测眼部图像中眼睛的类别为丹凤眼、三角眼、柳叶眼、狐狸眼或者杏眼,并发送给终端。以原始图像为眼底图像、原始图像中所本文档来自技高网
...

【技术保护点】
1.一种眼底图像分类方法,其特征在于,包括:获得眼底图像、以及所述眼底图像中所包括的眼球的类别;调整所述眼底图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;基于调整后的眼底图像和新图像构造的训练集、以及所包括眼球的类别,训练神经网络模型;基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,所述类别为以下之一:正常、温和非增值性、中度非增值性、重度非增值性及增值性。

【技术特征摘要】
1.一种眼底图像分类方法,其特征在于,包括:获得眼底图像、以及所述眼底图像中所包括的眼球的类别;调整所述眼底图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;基于调整后的眼底图像和新图像构造的训练集、以及所包括眼球的类别,训练神经网络模型;基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,所述类别为以下之一:正常、温和非增值性、中度非增值性、重度非增值性及增值性。2.如权利要求1所述的眼底图像分类方法,其特征在于,所述训练神经网络模型,包括:初始化神经网络模型;将所述训练集包括的图像以及对应的类别输入所述神经网络模型进行迭代训练,直至所述神经网络模型的损失函数满足收敛条件,得到用于对所述待预测眼底图像分类的单一神经网络模型。3.如权利要求2所述的眼底图像分类方法,其特征在于,还包括:根据K损失函数和多分类的对数损失函数以预设比例组合,得到所述神经网络模型的损失函数。4.如权利要求1所述的眼底图像分类方法,其特征在于,所述训练神经网络模型,包括:初始化神经网络模型;根据所述原始图像中所包含的至少两个眼球,初始化与所述神经网络模型顺序连接的级联层、全连接层、以及与所述眼球对应的分类层,得到用于对所述待预测眼底图像分类的组合神经网络模型;将所述训练集包括的图像以及对应的类别输入所述组合神经网络模型进行迭代训练,直至损失函数满足收敛条件。5.如权利要求1所述的眼底图像分类方法,其特征在于,所述基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,包括:在单一神经网络模型中,提取所述待预测眼底图像中的图像特征,将所提取的图像特征进行降采样处理;将降采样处理的特征映射到所述眼球属于不同类别的概率。6.如权利要求1所述的眼底图像分类方法,其特征在于,所述基于训练后的所述神经网络模型,确定待预测眼底图像中所包括眼球的类别,包括:在组合神经网络模型中,利用所述组合神经网络模型从至少两个眼球的待预测眼底图像中对应提取图像特征;将所提取的图像特征级联,并进行降采样处理;将降采样处理的图像特征,分别映射到所述至少两个眼球属于不同类别的概率。7.如权利要求1所述的眼底图像分类方法,其特征在于,所述调整所述眼底图像的显示参数满足取值条件,包括:检测所述眼底图像中所包括眼球的成像区域;调整所述眼底图像的尺寸,直至所述眼底图像所包括眼球的成像区域的尺寸一致。8.如权利要求1所述的眼底图像分类方法,其特征在于,所述调整所述眼底图像的显示参数满足取值条件,包括:基于所述眼底图像需要满足的识别度,对所述眼底图像的各个颜色通道进行图像增强处理。9.如权利要求1所述的眼底图像分类方法,其特征在于,所述...

【专利技术属性】
技术研发人员:彭湃郭晓威吴凯琳
申请(专利权)人:腾讯科技深圳有限公司腾讯云计算北京有限责任公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1