图片分类方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24169137 阅读:18 留言:0更新日期:2020-05-16 02:22
本申请涉及一种图片分类方法、装置、计算机设备和存储介质,使用的分类神经网络是基于初始神经网络训练的,且该初始神经网络的多个并联全连接层可输出不同属性类别数量,这样在训练初始神经网络时,训练全连接层时初始神经网络的特征提取层会学习图片中的参数特征,当训练初始神经网络中的不同的全连接层是,可进一步促进初始神经网络的特征提取层学习图片中的参数特征,相当于,对于多属性分类问题,通过在初始神经网络上设置多个并联全连接层,使得该神经网络对图片中的参数特征学习的更加精确,这样在使用训练好的分类神经网络对图片的属性进行分类时,得到的分类结果也更加精确。

Image classification method, device, computer equipment and storage medium

【技术实现步骤摘要】
图片分类方法、装置、计算机设备和存储介质
本申请涉及图片处理
,特别是涉及一种图片分类方法、装置、计算机设备和存储介质。
技术介绍
随着深度卷积神经网络在图片分类上的应用越来越广泛,单一属性的图片多分类越来越不能满足实际需求。目前,有许多多属性分类的例子,比如一部电影可以同时划分为动作片和科幻片、一张照片可同时划分为风景照和植物照等。通常,复杂的多属性分类,由于每类属性之间划分界限不一样,使得属性和属性之间存在一定关联,这样在训练深度卷积神经网络时,每类属性的界限划分不够精确,以至于训练的模型的不够收敛,也不能准确的识别出图片的每一类属性。
技术实现思路
基于此,有必要针对上述的技术问题,提供一种图片分类方法、装置、计算机设备和存储介质。第一方面,本申请实施例提供一种图片分类方法,该方法包括:获取多张多属性图片;将各图片输入至预设的分类神经网络中,得到多种属性分类结果;其中,分类神经网络是基于初始分类神经网络训练的,初始神经网络包括多个并联的全连接层,多个并联的全连接层共用一个输入层和特征提取层,每个全连接层输出的属性类别数量不同。在其中一个实施例中,上述分类神经网络的训练过程包括:获取多张样本多属性图片;将各样本多属性图片输入至输入层和特征提取层后,依照全连接层输出的属性类别数量从小到大,且前一个全连接层收敛后再训练下一个全连接的顺序,依次单独训练每个全连接层,直到所有的全连接层都收敛,注释掉除输出属性类别数量最大的全连接层以外的其它全部全连接层,得到分类神经网络。在其中一个实施例中,若初始神经网络的全连接层包括第一全连接层、第二全连接层和第三全连接层;第一全连接层输出的属性类别数量<第二全连接层输出的属性类别数量<第三全连接层输出的属性类别数量;则上述分类神经网络的训练过程包括:将各样本多属性图片输入至输入层和特征提取层后,训练第一全连接层,在第一全连接层收敛后训练第二全连接层,在第二全连接层收敛后训练第三全连接层,在第三全连接层收敛后,注释掉第一全连接层和第二全连接层,得到分类神经网络。在其中一个实施例中,上述初始分类神经网络还包括多个分类函数层,分类函数层分别连接在对应的全连接层后面;分类函数层,用于在训练过程中,将各全连接层的输出变换为预设区间的值,并根据预设区间的值与预设阈值的比较结果,确定各全连接层对应的分类结果,再基于标准分类结果预测各所述分类结果的准确率。在其中一个实施例中,上述各全连接层的损失函数存在关联关系;关联关系至少包括:按照全连接层的属性分类数量从小到大的顺序,从第二个全连接层开始,每一个全连接层的综合损失函数为当前全连接层的层级损失函数与当前全连接层之前的所有全连接层的层级损失函数的加权和。在其中一个实施例中,若初始神经网络的全连接层包括第一全连接层、第二全连接层和第三全连接层;第一全连接层的层级损失函数为第一损失函数,第二全连接层的层级损失函数为第二损失函数,第三全连接层为层级第三损失函数;则关联关系包括:第二全连接层的综合损失函数为第一损失函数与第二损失函数的加权和;第三全连接层的综合损失函数为第一损失函数、第二损失函数、第三损失函数的加权和。在其中一个实施例中,上述各全连接层收敛的条件包括:各全连接层的分类函数层预测的准确率达到预设准确率范围,且各全连接层的损失函数的值达到预设范围。第二方面,本申请实施例提供一种图片分类装置,该装置包括:获取模块,用于获取多张多属性图片;分类模块,用于将各图片输入至预设的分类神经网络中,得到多种属性分类结果;其中,分类神经网络是基于初始分类神经网络训练的,初始神经网络包括多个并联的全连接层,多个并联的全连接层共用一个输入层和特征提取层,每个全连接层输出的属性类别数量不同。第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面实施例提供的任一项方法的步骤。第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面实施例提供的任一项方法的步骤。本申请实施例提供的一种图片分类方法、装置、计算机设备和存储介质,使用的分类神经网络是基于初始神经网络训练的,且该初始神经网络的多个并联全连接层可输出不同属性类别数量,这样在训练初始神经网络时,训练全连接层时初始神经网络的特征提取层会学习图片中的参数特征,当训练初始神经网络中的不同的全连接层是,可进一步促进初始神经网络的特征提取层学习图片中的参数特征,相当于,对于多属性分类问题,通过在初始神经网络上设置多个并联全连接层,使得该神经网络对图片中的参数特征学习的更加精确,这样在使用训练好的分类神经网络对图片的属性进行分类时,得到的分类结果也更加精确。附图说明图1为一个实施例提供的一种图片分类方法的应用环境图;图2为一个实施例提供的一种图片分类方法的流程示意图;图3为一个实施例提供的一种初始神经网络结构示意图;图4为一个实施例提供的一种图片分类方法的流程示意图;图5为一个实施例提供的一种图片分类装置的结构框图;图6为一个实施例提供的一种图片分类装置的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的一种图片分类方法,可以应用于如图1所示的应用环境中,该应用环境中,计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图片分类的数据。该计算机设备的网络接口用于与外部的其他设备通过网络连接通信。该计算机程序被处理器执行时以实现一种图片分类方法。本申请实施例提供一种图片分类方法、装置、计算机设备和存储介质。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是,本申请提供的一种图片分类方法,图2-图4的执行主体为计算机设备,其中,其执行主体还可以是图片分类装置,其中该装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部。为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。在一个实施例中,图2提供了一种图片分类方法,本实施例涉及的本文档来自技高网...

【技术保护点】
1.一种图片分类方法,其特征在于,所述方法包括:/n获取多张多属性图片;/n将各所述图片输入至预设的分类神经网络中,得到多种属性分类结果;/n其中,所述分类神经网络是基于初始分类神经网络训练的,所述初始神经网络包括多个并联的全连接层,所述多个并联的全连接层共用一个输入层和特征提取层,每个全连接层输出的属性类别数量不同。/n

【技术特征摘要】
1.一种图片分类方法,其特征在于,所述方法包括:
获取多张多属性图片;
将各所述图片输入至预设的分类神经网络中,得到多种属性分类结果;
其中,所述分类神经网络是基于初始分类神经网络训练的,所述初始神经网络包括多个并联的全连接层,所述多个并联的全连接层共用一个输入层和特征提取层,每个全连接层输出的属性类别数量不同。


2.根据权利要求1所述的方法,其特征在于,所述分类神经网络的训练过程包括:
获取多张样本多属性图片;
将各所述样本多属性图片输入至所述输入层和所述特征提取层后,依照全连接层输出的属性类别数量从小到大,且前一个全连接层收敛后再训练下一个全连接的顺序,依次单独训练每个全连接层,直到所有的全连接层都收敛,注释掉除输出属性类别数量最大的全连接层以外的其它全部全连接层,得到所述分类神经网络。


3.根据权利要求2所述的方法,其特征在于,若所述初始神经网络的全连接层包括第一全连接层、第二全连接层和第三全连接层;所述第一全连接层输出的属性类别数量<所述第二全连接层输出的属性类别数量<所述第三全连接层输出的属性类别数量;
则所述分类神经网络的训练过程包括:
将各所述样本多属性图片输入至所述输入层和所述特征提取层后,训练所述第一全连接层,在所述第一全连接层收敛后训练所述第二全连接层,在所述第二全连接层收敛后训练所述第三全连接层,在所述第三全连接层收敛后,注释掉所述第一全连接层和所述第二全连接层,得到所述分类神经网络。


4.根据权利要求2或3所述的方法,其特征在于,所述初始分类神经网络还包括多个分类函数层,所述分类函数层分别连接在对应的全连接层后面;
所述分类函数层,用于在训练过程中,将各全连接层的输出变换为预设区间的值,并根据所述预设区间的值与预设阈值的比较结果,确定各所述全连接层对应的分类结果,再基于标准分类结果预测各所述分类结果的准确率。

【专利技术属性】
技术研发人员:周康明谈咏东
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1