混合粒度物体识别模型训练及识别方法、装置及存储介质制造方法及图纸

技术编号：22565732 阅读：13 留言：0更新日期：2019-11-16 12:18

本申请涉及互联网技术领域，公开了一种混合粒度物体识别模型训练及识别方法、装置及存储介质。所述混合粒度物体识别模型训练方法包括：获取样本图像，确定各样本图像的类别标签，所述类别标签包括细粒度类别和粗粒度类别；基于所述样本图像和所述样本图像的类别标签对初始深度学习模型进行图像的类别识别训练，得到预训练模型；以拉大细粒度类别之间的特征差异为目标对所述预训练模型的细粒度分支分类模块进行调整，得到混合粒度物体识别模型。本申请能够实现在同一个网络结构中进行粗粒度类别识别和细粒度类别识别，提升细粒度类别识别的准确性。

Training and recognition method, device and storage medium of mixed granularity object recognition model

The application relates to the field of Internet technology, and discloses a training and recognition method, device and storage medium of mixed granularity object recognition model. The training method of the mixed granularity object recognition model includes: obtaining the sample image, determining the category labels of each sample image, and the category labels include the fine-grained category and the coarse-grained category; training the initial depth learning model based on the category labels of the sample image and the sample image, and obtaining the pre training model; enlarging the fine-grained category The feature difference between them is that the target adjusts the fine-grained branch classification module of the pre training model to get the mixed granularity object recognition model. The application can realize coarse-grained category recognition and fine-grained category recognition in the same network structure, and improve the accuracy of fine-grained category recognition.

全部详细技术资料下载

【技术实现步骤摘要】
混合粒度物体识别模型训练及识别方法、装置及存储介质
本申请涉及互联网
，尤其涉及一种混合粒度物体识别模型训练及识别方法、装置及存储介质。
技术介绍
在实现物体识别的产品中，经常遇到的任务是既有粗粒度也有细粒度的识别。譬如当今人们喜欢养猫、狗、鸟等一类宠物，人们关注具体某种动物的细分类，因为不同细分类的动物具有差异较大的习性偏好、聪明程度，如狗类下的边境牧羊犬、贵宾犬、哈士奇等。这就需要用户首先知道动物属于哪一细分类，但是不熟悉宠物细分类的不乏其人，故在此类宠物识别中，不仅需要区分粗粒度类别(猫、狗、鸟等)，也需要识别每个粗粒度下的细分类别。当前在混合细粒度识别任务上，一般采用细粒度的分类模型进行识别。这种不区分粗细粒度的暴力识别方法容易对细粒度物体所在的粗粒度类别识别不足(如把猫识别成狗的某一细粒度种类)，而另外采用细粒度分类方法对目标特征进行细粒度计算的方法容易造成在某些种类细粒度识别较差的结果。
技术实现思路
本申请实施例提供了一种混合粒度物体识别模型训练及识别方法、装置及存储介质，可以提高粗粒度类别间的区分性，达到更好的细粒度识别效果。一方面，本申请实施例提供了一种混合粒度物体识别模型训练方法，该方法包括：获取样本图像，确定各样本图像的类别标签，所述类别标签包括细粒度类别和粗粒度类别；基于所述样本图像和所述样本图像的类别标签对初始深度学习模型进行图像的类别识别训练，得到预训练模型；以拉大细粒度类别之间的特征差异为目标对所述预训练模型的细粒度分支分类模块进...

【技术保护点】
1.一种混合粒度物体识别模型训练方法，其特征在于，所述方法包括：/n获取样本图像，确定各样本图像的类别标签，所述类别标签包括细粒度类别和粗粒度类别；/n基于所述样本图像和所述样本图像的类别标签对初始深度学习模型进行图像的类别识别训练，得到预训练模型；/n以拉大细粒度类别之间的特征差异为目标对所述预训练模型的细粒度分支分类模块进行调整，得到混合粒度物体识别模型。/n

【技术特征摘要】
1.一种混合粒度物体识别模型训练方法，其特征在于，所述方法包括：
获取样本图像，确定各样本图像的类别标签，所述类别标签包括细粒度类别和粗粒度类别；
基于所述样本图像和所述样本图像的类别标签对初始深度学习模型进行图像的类别识别训练，得到预训练模型；
以拉大细粒度类别之间的特征差异为目标对所述预训练模型的细粒度分支分类模块进行调整，得到混合粒度物体识别模型。

2.根据权利要求1所述的方法，其特征在于，所述获取样本图像，确定各样本图像的类别标签包括：
采集图像；
标注所述图像所属的细粒度类别；
根据所述图像的细粒度类别和所述细粒度类别的特征对所述图像进行聚类处理，得到多个图像集合，每个所述图像集合中各图像所属粗粒度类别相同；
根据所述图像集合中各图像所属细粒度类别的分布，确定混合粒度物体识别模型学习的目标粗粒度类别；
将与所述目标粗粒度类别对应的图像集合中的所有图像作为样本图像，并为各样本图像添加类别标签，所述类别标签包括细粒度类别和粗粒度类别。

3.根据权利要求1所述的方法，其特征在于，所述基于所述样本图像和所述样本图像的类别标签对初始深度学习模型进行图像的类别识别训练，得到预训练模型，包括：
将所述样本图像和所述样本图像的类别标签输入卷积神经网络模型；
对所述样本图像进行前向计算，得到所述样本图像属于粗粒度类别的预测概率和属于所述粗粒度类别下细粒度类别的预测概率；
基于所述粗粒度类别的预测概率和所述细粒度类别的预测概率确定所述样本图像的类别预测结果；
将所述类别预测结果与所述类别标签进行对比，计算得到粗粒度损失值和细粒度损失值；
计算所述粗粒度损失值和细粒度损失值的加权和作为整体损失值；
将所述整体损失值反向传播到卷积神经网络模型中，通过随机梯度下降法调整卷积神经网络模型的权重参数；
将所述样本图像和所述样本图像的类别标签输入更新权重参数后的卷积神经网络模型，重复上述调整权重参数步骤至当前调整权重参数步骤的执行次数达到预设次数；
将当前调整权重参数后的卷积神经网络模型作为所述预训练模型。

4.根据权利要求1所述的方法，其特征在于，所述以拉大细粒度类别之间的特征差异为目标对所述预训练模型的细粒度分支分类模块进行调整，得到混合粒度物体识别模型，包括：
对所述预训练模型进行前向计算，得到同一粗粒度类别下各样本图像的细粒度类别特征；
根据各样本图像的细粒度类别特征和同一粗粒度类别下其他样本图像的细粒度类别特征计算得到细粒度分支分类损失值；
确定各样本图像对应的正样本图像和负样本图像，根据所述样本图像、所述正样本图像和所述负样本图像计算得到三元组损失度量；所述正样本图像为与所述样本图像属同一细粒度类别的样本图像，所述负样本图像为与所述样本图像属同一粗粒度类别、不同细粒度类别的样本图像；
根据所述细粒度分支分类损失值和三元组损失度量计算得到总损失值；
根据所述总损失值调整所述细粒度分支分类模块的参数，得到混合...

【专利技术属性】
技术研发人员：郭卉，袁豪磊，黄飞跃，
申请(专利权)人：腾讯云计算北京有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人