一种对齐分类模型的训练方法和图像分类方法技术

技术编号:21400108 阅读:27 留言:0更新日期:2019-06-19 07:17
本发明专利技术公开了一种对齐分类模型的训练方法,对齐分类模型包括主网络、第一分支网络和第二分支网络,方法包括:获取经过标注的训练图像,训练图像具有相应的标注数据,标注数据包含图像的类别;将训练图像输入分类模型中进行训练,以得到训练后的第二分支网络;将训练图像输入对齐分类模型中进行训练,优化第二分支网络,以得到训练后的对齐分类模型。该方案能够提高模型分类的精度,并节约模型训练时间和所需的数据量。

【技术实现步骤摘要】
一种对齐分类模型的训练方法和图像分类方法
本专利技术涉及深度学习
,尤其涉及一种对齐分类模型的训练方法和图像分类方法、计算设备及存储介质。
技术介绍
猫狗脸分类有广泛的应用场景,例如在给猫狗拍照的过程中,通过区分是猫是狗,加入一些定制化的动画控件,增加用户的拍摄乐趣。但是传统的猫狗脸分类训练方法需要训练的数据量庞大,网络结构复杂,无法适应移动终端对数据大小和训练速度的要求。一方面,对于图像的分类,重新训练一个完整的网络需要耗费大量的时间;另一方面,现有的分类模型主要利用VGG等深度卷积网络从图像中提取特征,这种方法精度高但是耗时耗内存。目前大部分狗脸点对齐方案利用目标检测和跟踪算法进行实时跟踪。但是由于狗的品种繁多,且活泼好动,导致狗脸检测不稳定,影响预测狗脸点的精度。因此,需要一种对齐分类模型,能够同时具有对齐和分类的功能,能够进一步提高对齐和分类的准确性。
技术实现思路
为此,本专利技术提供了一种对齐分类模型的训练方法和图像分类方法、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。根据本专利技术的一个方面,提供了一种对齐分类模型的训练方法,适于在计算设备中执行。对齐分类模型包括主网络、第一分支网络和第二分支网络,其中主网络和第一分支网络构成对齐模型,适于输出预测特征点的坐标,主网络和第二分支网络构成分类模型,适于输出预测图像类别的概率。在该方法中,首先获取经过标注的训练图像,训练图像具有相应的标注数据,标注数据包含图像的类别。然后,将训练图像输入分类模型中进行训练,以得到训练后的第二分支网络。最后,将训练图像输入对齐分类模型中进行训练,优化第二分支网络,以得到训练后的对齐分类模型。可选地,主网络包括由卷积层、激活层、池化层组成的卷积处理层,其中设置有多个分组卷积。可选地,第一分支网络包括由全连接层和dropout层组成的分类处理层,第二分支网络包括卷积层、激活层、池化层、全连接层和归一化层。可选地,在上述方法中,训练图像包括狗脸图像、猫脸图像和其他图像。猫脸图像标注为0,狗脸图像标注为1,其他图像标注为2。可选地,在上述方法中,可以将已标注特征点的图像输入对齐模型中,以输出预测特征点的坐标;基于标注特征点坐标与预测特征点坐标的距离,计算第一损失函数的值;以及基于第一损失函数的值调整对齐模型的参数,以得到训练好的对齐模型。可选地,在上述方法中,对齐模型为狗脸对齐模型,适于输出狗脸点坐标。可选地,在上述方法中,可以基于训练好的对齐模型中主网络的参数和正态分布初始化方法,初始化分类模型的参数。然后,基于标注图像类别和预测图像类别,计算第二损失函数的值;以及基于预设的主网络的第一学习率、第二分支网络的第二学习率以及第二损失函数的值,训练分类模型。可选地,在上述方法中,在达到预定迭代次数的情况下,将主网络的参数重新初始化为训练好的对齐模型中主网络的参数。可选地,第一学习率大于所述第二学习率。可选地,在上述方法中,第二损失函数为交叉熵损失函数,交叉熵损失函数可以通过下述公式计算:其中,y′为已标注图像类别,y为预测的图像类别,i为图像的索引。根据本专利技术另一个方面,提供了一种图像分类方法,适于在计算设备中执行。包括将待分类图像输入对齐分类模型中,以输出待分类图像所属的图像类别,其中对齐分类模型利用上述对齐分类模型的训练方法来训练生成。可选地,当待分类图像中包含狗脸图像时,输出预测的狗脸点坐标。根据本专利技术另一个方面,提供了一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上所述方法中的任一方法的指令。根据本专利技术的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当计算设备执行时,使得计算设备执行如上所述的方法中的任一方法。根据本专利技术的方案,首先通过在已训练好的对齐模型中加入分类分支,使模型同时具备分类和对齐的功能。首先利用主网络训练。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本专利技术的一个实施例的计算设备100的构造示意图;图2示出了根据本专利技术的一个实施例的对齐分类模型训练方法200的示意性流程图;图3示出了根据本专利技术的一个实施例的对齐模型300的网络结构示意图;图4示出了根据本专利技术的一个实施例的第二分支网络400的网络结构示意图;图5示出了根据本专利技术的一个实施例的分类模型500的结构示意图;图6示出了根据本专利技术的一个实施例的对齐分类模型600的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行对齐分类模型的训练方法200或图像分类方法,程序数据124中就包含了用于执行上述各方法的指令。计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入本文档来自技高网...

【技术保护点】
1.一种对齐分类模型的训练方法,适于在计算设备中执行,所述对齐分类模型包括主网络、第一分支网络和第二分支网络,所述主网络和第一分支网络构成对齐模型,适于输出预测特征点的坐标,所述主网络和第二分支网络构成分类模型,适于输出预测图像类别的概率,所述方法包括:获取经过标注的训练图像,所述训练图像具有相应的标注数据,所述标注数据包含图像的类别;将所述训练图像输入分类模型中进行训练,以得到训练后的第二分支网络;以及将所述训练图像输入对齐分类模型中进行训练,优化所述第二分支网络,以得到训练后的对齐分类模型。

【技术特征摘要】
1.一种对齐分类模型的训练方法,适于在计算设备中执行,所述对齐分类模型包括主网络、第一分支网络和第二分支网络,所述主网络和第一分支网络构成对齐模型,适于输出预测特征点的坐标,所述主网络和第二分支网络构成分类模型,适于输出预测图像类别的概率,所述方法包括:获取经过标注的训练图像,所述训练图像具有相应的标注数据,所述标注数据包含图像的类别;将所述训练图像输入分类模型中进行训练,以得到训练后的第二分支网络;以及将所述训练图像输入对齐分类模型中进行训练,优化所述第二分支网络,以得到训练后的对齐分类模型。2.如权利要求1所述的方法,其中,所述训练图像包括狗脸图像、猫脸图像和其他图像,猫脸图像标注为0,狗脸图像标注为1,其他图像标注为2。3.如权利要求1所述的方法,其中,所述方法包括:将已标注特征点的图像输入对齐模型中,以输出预测特征点的坐标;基于标注特征点坐标与预测特征点坐标的距离,计算第一损失函数的值;以及基于第一损失函数的值调整对齐模型的参数,以得到训练好的对齐模型。4.如权利要求3所述的方法,其中,所述对齐模型为狗脸对齐模型,适于输出狗脸点坐标。5.如权利要求1所述的方法,其中,所述将训练图像输入分类模型中进行训练的步骤包括:基于训练好的对齐模型中主网络的参数和正态分布初始化方法,初始化分类模...

【专利技术属性】
技术研发人员:许益鸿齐子铭涂清华李志阳张伟
申请(专利权)人:厦门美图之家科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1