分类模型训练方法及装置制造方法及图纸

技术编号:21362740 阅读:27 留言:0更新日期:2019-06-15 09:37
本申请公开了一种分类模型训练方法及装置,通过单独计算每个标签的二值交叉熵,提高所获得的标签的精度。详细地,首先通过获取多个第一训练样本,其中,每个第一训练样本包括第一训练图像以及与该第一训练图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类以及下位分类分别对应的标签;然后,根据多个所述第一训练样本进行机器学习训练,获得初始分类模型;在获得初始分类模型后,分别获取初始分类模型中每个标签的二值交叉熵作为该标签的子误差值;最后,根据每个标签的子误差值获得初始分类模型的总误差值,进而根据所述总误差值调整所述初始分类模型,获得目标分类模型。

Classification Model Training Method and Device

This application discloses a classification model training method and device, which improves the accuracy of the obtained tags by calculating the binary cross-entropy of each tag separately. In detail, first, by acquiring multiple first training samples, each first training sample includes a first training image and a first preset number of labels corresponding to the first training image, and the first preset number of labels includes labels corresponding to the upper and lower classifications corresponding to the image content; then, according to multiple first training samples, the first training sample is imported. Machine learning training is performed to obtain the initial classification model; after obtaining the initial classification model, the binary cross-entropy of each label in the initial classification model is obtained as the sub-error value of the label; finally, the total error value of the initial classification model is obtained according to the sub-error value of each label, and then the initial classification model is adjusted according to the total error value to obtain the target classification model. Type.

【技术实现步骤摘要】
分类模型训练方法及装置
本申请涉及图像处理
,具体而言,涉及一种分类模型训练方法及装置。
技术介绍
现有技术中,在图像分类时,有两大类常见的分类方法,其中一种分类方法就是单标签分类方法,在这种方法中,每张图像只击打一个标签,也就是说,每张图像只分为一个类别,因此,这种分类方法并不能完整地表达图像的语义;另一种分类方法是多标签分类,这种方法中,同一图像可以对应击打多个标签,也就是说,每张图像可以划分为多个类别。在现有的多标签分类算法中,如果同一图像对应的多个标签中存在一个标签所对应的含义是另一个或多个标签所对应含义的上位分类,即这些标签之间存在依赖关系。现有的多标签分类算法中,若识别到的图像分类具有存在依赖关系的多个标签,只有输出其中一个标签作为该图像的分类标签。因此,现有多标签分类方法存在输出的标签精度低的问题。
技术实现思路
为了克服现有技术中的上述不足,本申请的目的在于提供一种分类模型训练方法,所述方法包括:获取多个第一训练样本,其中,每个第一训练样本包括第一训练图像以及与该第一训练图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类以及下位分类分别对应的标签;根据多个所述第一训练样本进行机器学习训练,获得初始分类模型;分别获取初始分类模型中每个标签的二值交叉熵作为对应的子误差值;根据所述每个标签的子误差值计算获得所述初始分类模型的总误差值;根据所述总误差值调整所述初始分类模型,获得目标分类模型。可选地,所述根据所述总误差值调整所述初始分类模型,获得目标分类模型的步骤包括:检测所述总误差值是否大于预设值;若所述总误差值大于预设值,则调整所述初始分类模型的参数,直至所述总误差值小于所述预设值;若所述总误差值小于所述预设值,则将调整参数后的初始分类模型作为目标分类模型。可选地,所述获取多个第一训练样本的步骤前,所述方法还包括:获取多个初始样本,每个所述初始样本包括初始图像以及与该初始图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类的标签以及下位分类的标签;针对每个初始样本,对该初始样本中的所述初始图像进行变换,获得多个所述第一训练样本。可选地,所述变换包括随机裁剪、随机翻转、随机颜色调整或随机亮度调整中的至少一种。可选地,所述根据多个所述第一训练样本进行机器学习训练,获得初始分类模型的步骤包括:将所述多个第一训练样本输入已训练的预分类模型,对该预分类模型进行再次训练;对所述预分类模型进行调整,获得所述初始分类模型。可选地,所述预分类模型包括卷积层、池化层和全连接层,所述对所述预分类模型进行调整,获得所述初始分类模型的步骤包括:对所述预分类模型的全连接层的参数进行调整,获得中间模型;分别对中间模型的卷积层、池化层和全连接层的参数进行调整,获得初始分类模型。可选地,所述根据多个所述第一训练样本进行机器学习训练,获得初始分类模型的步骤前,所述方法还包括:将第二训练样本输入深度学习框架,获得所述预分类模型;其中,所述第二训练样本包括第二训练图像以及与每个第二训练图像对应的第二预设数量个标签。可选地,所述方法还包括:将待识别图像输入所述目标分类模型,获得所述待识别图像对应的第一预设数量个标签。本申请的另一目的在于提供一种分类模型训练装置,所述装置包括获取模块、训练模块、计算模块和调整模块;所述获取模块用于获取多个第一训练样本,其中,每个第一训练样本包括第一训练图像以及与该第一训练图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类的标签以及下位分类的标签;所述训练模块用于根据多个所述第一训练样本进行机器学习训练,获得初始分类模型;所述计算模块用于分别获取初始分类模型中每个标签的二值交叉熵作为对应的子误差值,以及根据所述每个标签的子误差值计算所述初始分类模型的总误差值;所述调整模块用于根据所述总误差值调整所述初始分类模型,获得目标分类模型。可选地,所述调整模块用于根据所述总误差值调整所述初始分类模型,获得目标分类模型的步骤包括:检测所述总误差值是否大于预设值;若所述总误差值大于预设值,则调整所述初始分类模型的参数,直至所述总误差值小于所述预设值;若所述总误差值小于所述预设值,则将调整参数后的初始分类模型作为目标分类模型。相对于现有技术而言,本申请具有以下有益效果:本申请实施例中,通过为每个图像设置多个标签来进行机器学习训练,获得初始分类模型,并分别获取每个标签的二值交叉熵,从而根据每个标签的二值交叉熵来计算初始分类模型的总误差值,进而根据初始分类模型的总误差来调整该初始分类模型的参数。如此,由于各个标签对应的子误差值是单独计算的,各个标签对应的子误差值不会受到其他标签的影响,使得同一图像可以同时具有一上位分类对应的标签以及该上位分类对应的下位分类对应的标签,也就是说,训练出的目标分类模型的分类精度能够得到提高。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的分类模型训练设备的结构示意框图;图2为本申请实施例提供的分类模型训练方法的流程示意图一;图3为本申请实施例提供的分类模型训练方法的流程示意图二;图4为本申请实施例提供的分类模型训练方法的流程示意图三;图5为本申请实施例提供的分类模型训练方法的流程示意图四;图6为本申请实施例提供的分类模型训练方法的流程示意图五;图7为本申请实施例提供的分类模型训练方法的流程示意图六;图8为本申请实施例提供的分类模型训练方法的流程示意图七;图9为本申请实施例提供的分类模型训练装置的结构示意框图。图标:100-分类模型训练设备;110-分类模型训练装置;111-获取模块;112-训练模块;113-计算模块;114-调整模块;120-存储器;130-处理器。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。在对图像进行分类处理时,会先训练出一个模型,现有技术中,所训练出的模型在对图像进行分类时,一般会存在两种分类方法,其中一种分类方法就是单标签分类方法,在这种方法中,每张图像只击打一个标签,也就是说,每张图像只分为一个类别,因此,这种分类方法并不能完整地表达图像的语义。现有技术中的另一种分类方法是多标签分类,这种方法中,同一图像可以对应击打多个标签,也就是说,每张图像可以划分为多个类别。然而,在多标签分类算法中,如果同一图像对应的多个标签中存在一个标签所对应的含义是另一个或多个标签所对应含义的上位分类,那么,就说明这些标签之间会相互依赖,这些相互依赖的标签中,就只有一个会存在于该图像的输出标签中。例如,图像对应有一级标签护肤,护肤标签下对应有二级标签护肤效果,护肤效果的标签下对应有三级标签美白、补水等,这种情况下,图像就不可能同时被标注为护肤标签、护肤效果标签、美白标签和补水标签,而只能被标注为这四种标签中的一种标签,因此,现有的多标签分类方法会存在输出的标本文档来自技高网...

【技术保护点】
1.一种分类模型训练方法,其特征在于,所述方法包括:获取多个第一训练样本,其中,每个第一训练样本包括第一训练图像以及与该第一训练图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类以及下位分类分别对应的标签;根据多个所述第一训练样本进行机器学习训练,获得初始分类模型;分别获取初始分类模型中每个标签的二值交叉熵作为对应的子误差值;根据所述每个标签的子误差值计算获得所述初始分类模型的总误差值;根据所述总误差值调整所述初始分类模型,获得目标分类模型。

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,所述方法包括:获取多个第一训练样本,其中,每个第一训练样本包括第一训练图像以及与该第一训练图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类以及下位分类分别对应的标签;根据多个所述第一训练样本进行机器学习训练,获得初始分类模型;分别获取初始分类模型中每个标签的二值交叉熵作为对应的子误差值;根据所述每个标签的子误差值计算获得所述初始分类模型的总误差值;根据所述总误差值调整所述初始分类模型,获得目标分类模型。2.根据权利要求1所述的分类模型训练方法,其特征在于,所述根据所述总误差值调整所述初始分类模型,获得目标分类模型的步骤包括:检测所述总误差值是否大于预设值;若所述总误差值大于预设值,则调整所述初始分类模型的参数,直至所述总误差值小于所述预设值;若所述总误差值小于所述预设值,则将调整参数后的初始分类模型作为目标分类模型。3.根据权利要求1所述的分类模型训练方法,其特征在于,所述获取多个第一训练样本的步骤前,所述方法还包括:获取多个初始样本,每个所述初始样本包括初始图像以及与该初始图像对应的第一预设数量个标签,所述第一预设数量个标签包括与图像内容对应的上位分类的标签以及下位分类的标签;针对每个初始样本,对该初始样本中的所述初始图像进行变换,获得多个所述第一训练样本。4.根据权利要求3所述的分类模型训练方法,其特征在于,所述变换包括随机裁剪、随机翻转、随机颜色调整或随机亮度调整中的至少一种。5.根据权利要求1所述的分类模型训练方法,其特征在于,所述根据多个所述第一训练样本进行机器学习训练,获得初始分类模型的步骤包括:将所述多个第一训练样本输入已训练的预分类模型,对该预分类模型进行再次训练;对所述预分类模型进行调整,获得所述初始分类模型。6.根据权利要求5所述的分类模型训练方法,其特征在于...

【专利技术属性】
技术研发人员:王辰龙
申请(专利权)人:厦门美图之家科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1