【技术实现步骤摘要】
获取图像标签的方法、训练图像识别模型的方法和装置
本申请涉及图像处理领域,并且更具体地,涉及获取图像标签的方法,训练图像识别模型的方法、图像识别方法和相关装置。
技术介绍
精细图像识别(fine-grainedvisualcategorization,FGVC),又被称作子类别的图像识别(sub-categoryrecognition),是近年来计算机视觉、模式识别等领域一个非常热门的研究课题,其目的是对粗粒度的大类别进行更加细致的子类划分。精细图像识别相对通用图像(general/genericimages)识别,或者说相对于粗粒度的图像识别的区别和难点在于图像所属类别的粒度更为精细。例如,通用的图像识别的目标是将“袋鼠”和“狗”这两个物体大类分开;而精细图像识别则要求对“狗”这个类别下细粒度的子类进行辨识,即识别图像中的狗为“哈士奇”或“爱斯基摩犬”。与通用图像识别类似,可以使用精细图像识别模型来实现精细图像识别。用于实现精细图像识别的精细图像识别模型是使用标注了精细粒度类别的训练图像对图像识别模型进行训练得到的 ...
【技术保护点】
1.一种获取图像标签的方法,其特征在于,包括:/n获取第一类别推测信息,所述第一类别推测信息用于表示第一图像的类别为M种精细粒度类别中每种精细粒度类别的概率,M为正整数;/n根据所述第一类别推测信息,确定所述M种精细粒度类别基于所述M种精细粒度类别对应的M个概率的熵;/n所述熵小于或等于预设的阈值时,根据所述第一类别推测信息确定所述第一图像的目标类别标签信息,所述目标类别标签信息用于表示所述第一图像的目标精细粒度类别。/n
【技术特征摘要】
1.一种获取图像标签的方法,其特征在于,包括:
获取第一类别推测信息,所述第一类别推测信息用于表示第一图像的类别为M种精细粒度类别中每种精细粒度类别的概率,M为正整数;
根据所述第一类别推测信息,确定所述M种精细粒度类别基于所述M种精细粒度类别对应的M个概率的熵;
所述熵小于或等于预设的阈值时,根据所述第一类别推测信息确定所述第一图像的目标类别标签信息,所述目标类别标签信息用于表示所述第一图像的目标精细粒度类别。
2.根据权利要求1所述的方法,其特征在于,所述获取第一类别推测信息,包括:
获取所述第一图像的K个部位特征,K为大于1的整数,所述K个部位特征中,任意两个部位特征中包括不同的特征;
根据所述K个部位特征确定第一评分信息,所述第一评分信息用于表示所述K个部位特征中每个部位特征的类别为所述每种精细粒度类别的评分;
根据所述第一评分信息确定所述第一类别推测信息。
3.根据权利要求2所述的方法,其特征在于,所述获取第一类别推测信息,包括:
使用精细图像识别模型对所述第一图像进行识别,得到所述第一类别推测信息,其中,所述精细图像识别模型中的参数是根据第二评分信息进行调整得到的,所述第二评分信息用于表示第一特征集中每个部位特征的类别为所述M种精细粒度类别中每种精细粒度类别的评分,且所述第二评分信息是所述精细图像识别模型的分类器根据第一特征集确定的,所述第一特征集是所述精细图像识别模型的特征提取层从第二图像中提取的,所述第一特征集中包括所述第二图像的K个部位特征,所述第二图像的类别为所述M种精细粒度类别中的第一类别。
4.根据权利要求3所述的方法,其特征在于,所述精细图像识别模型中的参数是根据第二评分信息进行调整得到的,包括:
所述精细图像识别模型中的参数是根据所述第二评分信息和第三评分信息进行调整得到的,所述第三评分信息用于表示第二特征集中每个部位特征的类别为所述M种精细粒度类别中每种精细粒度类别的评分,且所述第三评分信息是所述精细图像识别模型中的分类器根据第二特征集确定的,所述第二特征集是去掉所述第一特征集中的每个部位特征中的第一特征得到的,所述第一特征为所述第一特征集中的第一部位特征所包含的特征。
5.根据权利要求4所述的方法,其特征在于,所述第一部位特征为所述第一特征集中评分最高的部位特征。
6.一种训练图像识别模型的方法,其特征在于,包括:
使用图像识别模型的特征提取层获取第二图像的第一特征集,所述第一特征集中包括所述第二图像的K个部位特征,K为大于1的整数;
使用所述图像识别模型的分类器,根据所述第一特征集确定第二评分信息,所述第二评分信息用于表示所述第一特征集中每个部位特征的类别为M种类别中每种类别的评分,M为正整数;
去掉所述第一特征集中的每个部位特征中的第一特征,得到第二特征集,所述第一特征为所述第一特征集中的第一部位特征所包含的特征;
使用所述图像识别模型的分类器,根据所述第二特征集确定第三评分信息,所述第三评分信息用于表示所述第二特征集中每个部位特征的类别为所述M种类别中每种类别的评分;
根据所述第二评分信息和所述第三评分信息,调整所述图像识别模型的参数。
7.根据权利要求6所述的方法,其特征在于,所述第一部位特征为所述第一特征集中评分最高的部位特征。
8.一种图像识别方法,其特征在于,包括:
获取第一图像;
使用图像识别模型对所述第一图像进行识别,以得到所述第一图像的类别,其中,所述图像识别模型中的参数是根据第二评分信息和第三评分信息进行调整得到的,所述第二评分信息用于表示第一特征集中每个部位特征的类别为M种精细粒度类别中每种精细粒度类别的评分,且所述第二评分信息是所述图像识别模型的分类器根据第一特征集确定的,所述第一特征集是所述图像识别模型的特征提取层从所述第一图像中提取的,所述第三评分信息用于表示第二特征集中每个部位特征的类别为所述M种精细粒度类别中每种精细粒度类别的评分,且所述第三评分信息是所述图像识别模型中的分类器根据所述第二特征集确定的,所述第二特征集是去掉所述第一特征集中的每个部位特征中的第一特征得到的,所述第一特征为所述第一特征集中的第一部位特征所包含的特征,K为大于1的整数,M为正整数。
9.根据权利要求8所述的方法,其特征在于,所述第一部位特征为所述第一特征集中评分最高的部位特征。
10.一种获取图像标签的装置,其特征在于,包括:
获取模块,用于获取第一类别推测信息,所述第一类别推测信息用于表示第一图像的类别为M种精细粒度类别中每种精细粒度类别的概率,M为正整数;
确定模块,用于根据所述第一类别推测信息,确定所述M种精细粒度类别基于所述M种精细粒度类别对应的M个评分的熵;
所述确定模块还用于在所述熵小于或等于预设的阈值时,根据所述第一类别推测信息确定所述第一图像的目标类别标签信息,所述目标类别标签信息用于表示所述第一图像的目标精细粒度类别。
11.根据权利要求10所述的装置,其特征在于,所述获取模块具体用于:
获取所述第一图像的K个部位特征,K为大于1的整数...
【专利技术属性】
技术研发人员:李昊,张晓鹏,田奇,王子辰,唐福辉,韩建华,钮敏哲,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。