基于元学习和记忆网络的图像分类方法及系统技术方案

技术编号:30375551 阅读:17 留言:0更新日期:2021-10-16 18:04
本发明专利技术公开了一种基于元学习和记忆网络的图像分类方法及系统,首先学习得到图像原始特征表示;设置一个记忆网络模块,记忆网络模块中的每一个记忆块对应保存着相应类别的元知识;将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示;将图像最终特征表示映射到所有记忆块上,计算得到其在每一个记忆块对应类别上的概率值,根据概率值的大小判断其所属分类。本发明专利技术通过设计与类别一一对应的记忆块并构成记忆网络模块,每一个记忆块对应相应类别的元知识,同时通过共享记忆块的模式,学习类别间的元知识信息,从而当同类图像对其操作时起到辅助作用的同时抑制其他类图像在该类上的表现,实现更好的预测。实现更好的预测。实现更好的预测。

【技术实现步骤摘要】
基于元学习和记忆网络的图像分类方法及系统


[0001]本专利技术涉及图像识别分类
,尤其是涉及一种基于元学习和记忆网络的图像分类方法及系统。

技术介绍

[0002]伴随着大数据时代和高性能计算资源技术的到来和提升,深度学习已经将人工智能的发展推进了一个新的阶段,由于深度学习在各个领域取得的优秀成就,目前基于深度学习的算法已成为人工智能领域研究的主流方法,计算机视觉方向研究是人工智能研究中的重要组成部分之一。其中图片作为一种常见的视觉媒介,充斥在互联网时代的各个角落,它凭借其简单,清晰的特点,在信息传递过程中发挥着重要作用。尤其随着web时代的普及,图片信息已经呈爆炸性增长。如果能够充分利用好这些信息,无疑对生产生活都有极大的便利之处。目前图像研究方向中,图片分类是主要研究方向之一,其有着广泛的应用场景,如物种识别,种类识别,人脸识别以及医学领域的一些应用等。这将会在一些工作场景中大大减轻人工工作量,减少人类的主观误差,大大提升工作效率。
[0003]目前图像分类的方法,大多基于深度学习模型,其中包括典型的VGG网络,GoogLeNet以及ResNet,由于图像是一个空间信息,因此这些模型都是基于Convolutional Neural Network(CNN)网络搭建实现的。然而值得注意的是,传统的图像分类在对某一图像进行分类往往只关注于图片本身的特征(这里不包括多模态,如加入文本信息,以及加入其他额外的信息,而是特指当信息只有图片本身时),却很少关注于任务本身所持有的一些元信息。根据现实场景显而易见,同一类图片是有很大的共性知识,以最普通的物种分类为例,当数据包含猫和狗两类图片时,同属于猫的图片一定在某些地方有着其相同的地方。而传统的方法中往往忽视了这一点,或者没有很好地利用这一特性,这就导致同一类图片之间没有直接共享信息,而只是通过间接的方式共享。这种方法带来的弊端包括:一是模型收敛较慢,需要花费更长的时间来训练网络,这无疑增加了计算代价;二是在一定程度上降低了模型的性能,使得模型的性能没有实现最大化。

技术实现思路

[0004]本专利技术的目的在于克服上述技术不足,提出一种基于元学习和记忆网络的图像分类方法及系统,其能实现当同类图像对其操作时起到辅助作用的同时抑制其他类图像在该类上的表现的有益效果。
[0005]为达到上述技术目的,本专利技术的技术方案第一方面提供一种基于元学习和记忆网络的图像分类方法,其包括如下步骤:将图像分类数据输入深度分类学习模型中学习得到图像原始特征表示;设置一个记忆网络模块,所述记忆网络模块包括多个记忆块,每一个记忆块对应保存着相应类别的元知识;将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中
获得图像最终特征表示;将图像最终特征表示映射到所有记忆块上,通过softmax计算得到其在每一个记忆块对应类别上的概率值,根据概率值的大小判断其所属分类。
[0006]本专利技术第二方面提供一种基于元学习和记忆网络的图像分类系统,其包括如下功能模块:图像学习模块,用于将图像分类数据输入深度分类学习模型中学习得到图像原始特征表示;记忆网络设置模块,用于设置一个记忆网络模块,所述记忆网络模块包括多个记忆块,每一个记忆块对应保存着相应类别的元知识;记忆读取模块,用于将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示;类别判断模块,用于将图像最终特征表示映射到所有记忆块上,通过softmax计算得到其在每一个记忆块对应类别上的概率值,根据概率值的大小判断其所属分类。
[0007]本专利技术第三方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于元学习和记忆网络的图像分类方法的步骤。
[0008]本专利技术第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于元学习和记忆网络的图像分类方法的步骤。
[0009]与现有技术相比,本专利技术通过设计与类别一一对应的记忆块并构成记忆网络模块,保证每一个记忆块都保存的是自己所对应类别的元知识,同时通过共享记忆块的模式,学习类别间的元知识信息,将其直接用于任务学习中,从而当同类图像对其操作时起到辅助作用的同时抑制其他类图像在该类上的表现,实现更好的预测。
附图说明
[0010]图1是本专利技术实施例所述的基于元学习和记忆网络的图像分类方法的流程框图;图2是本专利技术实施例所述的基于元学习和记忆网络的图像分类方法的另一流程框图;图3是图2中步骤S1a的分步骤流程框图;图4是本专利技术实施例所述的基于元学习和记忆网络的图像分类系统的模块框图。
具体实施方式
[0011]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0012]基于上述内容,本专利技术实施例提供一种基于元学习和记忆网络的图像分类方法,如图1所示,其包括如下步骤:S1、将图像分类数据输入深度分类学习模型中学习得到图像原始特征表示;基于深度学习常用的图像分类模型包括VGG,ResNet网络模型等,本专利技术以ResNet
网络为例,输入通过ResNet网络学习之后,得到图像原始特征表示。
[0013]如图2所示,在进行深度学习之前,还包括步骤S1a;S1 a、对图像分类数据进行预处理;具体的,如图3所示,步骤S1a包括如下分步骤:S1a1、收集图像分类任务的数据集;S1a2、对数据集中的图像数据进行大小比例调整,直至所有图像数据符合深度分类学习模型输入的统一大小尺寸;S1a3、采用常用的图像处理库获取数据集中所有图像数据的多通道二维表示,并将其转化成张量表示,作为深度分类学习模型的输入。
[0014]S2、设置一个记忆网络模块,所述记忆网络模块包括多个记忆块,每一个记忆块对应保存着相应类别的元知识。
[0015]整个记忆网络模块包含n个记忆块 M,其中n为类别数目,其对应类别的总数目,每一个记忆块对应保存着相应类别的元知识。
[0016]在进行图像类别的精细化分类前,还可以在记忆网络模块中增加一个记忆块,该记忆块对应的类为背景类,则记忆网络模块包含n+1个记忆块,所述背景类的记忆块能够在图像类别进行精细化分类前,对图像数据进行粗略判断,即判断图像是否是背景图像,如果是背景图像,则不再进行精细化分类。
[0017]S3、将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示。
[0018]其中,当类别数目较少时,即未超过某一设定范围时,将图像原始特征表示分别与每一个记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示。
[0019]具体的,将图像原始特征表示分别与记忆网络模块进行读写操作,读过程是将图像原始特征表示分别与每一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于元学习和记忆网络的图像分类方法,其特征在于,包括如下步骤:将图像分类数据输入深度分类学习模型中学习得到图像原始特征表示;设置一个记忆网络模块,所述记忆网络模块包括多个记忆块,每一个记忆块对应保存着相应类别的元知识;将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示;将图像最终特征表示映射到所有记忆块上,通过softmax计算得到其在每一个记忆块对应类别上的概率值,根据概率值的大小判断其所属分类。2.根据权利要求1所述基于元学习和记忆网络的图像分类方法,其特征在于,在所述将图像分类数据输入深度分类学习模型中学习得到图像原始特征表示之前,还需要对图像分类数据进行预处理;所述对图像分类数据进行预处理包括如下内容:收集图像分类任务的数据集;对数据集中的图像数据进行大小比例调整,直至所有图像数据符合深度分类学习模型输入的统一大小尺寸;采用常用的图像处理库获取数据集中所有图像数据的多通道二维表示,并将其转化成张量表示,作为深度分类学习模型的输入。3.根据权利要求1所述基于元学习和记忆网络的图像分类方法,其特征在于,在记忆网络模块中增加一记忆块,该记忆块对应保存着的类为背景类。4.根据权利要求1所述基于元学习和记忆网络的图像分类方法,其特征在于,所述将图像原始特征表示分别与记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示;包括:当类别数目未超过设定范围时,将图像原始特征表示分别与每一个记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示;当类别数目超过设定范围时,将图像原始特征表示分别与部分记忆块进行计算得到读参数,利用读参数从记忆块中获得图像最终特征表示。5.根据权利要求4所述基于元学习和记忆网络的图像分类方法,其特征在于,所述将图像原始特征表示分别与部分记忆块进行计算得...

【专利技术属性】
技术研发人员:张凯马乐乐丁冬睿魏红雷孔妍房体品
申请(专利权)人:广东众聚人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1