基于信息熵的细分类识别模型训练、图像识别方法及装置制造方法及图纸

技术编号：23605548 阅读：50 留言：0更新日期：2020-03-28 06:25

本发明专利技术提供了一种基于信息熵的细分类识别模型训练、图像识别方法及装置，涉及机器学习技术领域，包括：获取输入图像，并确定所述输入图像的特征向量；根据所述特征向量进行分类，确定所述分类后每个类别的预测值；根据所述预测值以及每个所述类别对应的标签值构建融合损失函数；根据所述融合损失函数对所述细分类识别模型进行训练，以更新所述细分类识别模型的参数。本发明专利技术使用神经网络对输入图像进行特征提取和分类。根据分类的预测值与对应标签值构建对偶交叉熵和最大熵损失函数。可在不增加模型复杂度和计算量的情况下，使得分类准确率得到大幅的提升。还可以在保证我类置信度的情况下，让模型在细粒度图像识别的鲁棒性更强。

Training of fine classification recognition model and image recognition method and device based on information entropy

全部详细技术资料下载

【技术实现步骤摘要】
基于信息熵的细分类识别模型训练、图像识别方法及装置
本专利技术涉及机器学习
，具体而言，涉及一种基于信息熵的细分类识别模型训练、图像识别方法及装置。
技术介绍
图像分类是计算机视觉研究领域的一个经典课题，主要包括粗粒度和细粒度图像分类。其中细粒度图像分类(Fine-grainedImageClassification，FGIC)是对一个粗粒度大类别进行更精细的子类划分，例如区分鸟的种类、车的品牌款式以及狗的品种等。在很多情况下细粒度图像分类更具有使用价值，成为近年来计算机视觉领域的热点研究问题。但由于这些子类别通常具有较小的类间差异，往往需要依靠微小的局部差异对类别进行区分，例如鸟类数据集中的某两种非常相似的鸟类，仅喙部形态具有较大不同。而相比类间差异，细粒度图像分类中通常存在较大的类内差异，包括物体姿态、尺度、视角、光照、遮挡以及背景干扰等。因此与普通的图像分类任务相比，细粒度图像分类的研究具有更大的挑战性。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题，为达上述目...

【技术保护点】
1.一种基于信息熵的细分类识别模型训练方法，其特征在于，包括：/n获取输入图像，并确定所述输入图像的特征向量；/n根据所述特征向量进行分类，确定所述分类后每个类别的预测值；/n根据所述预测值以及每个所述类别对应的标签值构建融合损失函数，所述融合损失函数基于信息熵进行构建；/n根据所述融合损失函数对所述细分类识别模型进行训练，以更新所述细分类识别模型的参数。/n

【技术特征摘要】
1.一种基于信息熵的细分类识别模型训练方法，其特征在于，包括：
获取输入图像，并确定所述输入图像的特征向量；
根据所述特征向量进行分类，确定所述分类后每个类别的预测值；
根据所述预测值以及每个所述类别对应的标签值构建融合损失函数，所述融合损失函数基于信息熵进行构建；
根据所述融合损失函数对所述细分类识别模型进行训练，以更新所述细分类识别模型的参数。

2.根据权利要求1所述的基于信息熵的细分类识别模型训练方法，其特征在于，所述信息熵包括对偶交叉熵和最大熵。

3.根据权利要求2所述的基于信息熵的细分类识别模型训练方法，其特征在于，所述融合损失函数根据所述预测值以及所述每个类别对应的标签值的所述对偶交叉熵进行构建，还根据所述预测值的所述最大熵进行构建。

4.根据权利要求3所述的基于信息熵的细分类识别模型训练方法，其特征在于，根据所述对偶交叉熵构建的损失函数表示为：
LDCE＝LCE+βLr

其中，M表示训练过程中一个batch中的数据数量，yi表示每个所述类别对应的标签值，T表示向量转置符号，pi表示每个所述类别对应的预测值，α、β均表示可调节的超参数。

5.根据权利要求4所述的基于信息熵的细分类识别模型训练方法，其特征在于，所述融合损失函数表示为：

其中，γ表示可调节的超参数，θ表示所述细分类识别模型的参数。

6.根据权利要求1所述的基于信息熵的细分类识别模型训练方法，其特征在于，所述根据所述融合损失函数对所述细分类识别模型进行训练，以更新所述细分类识别模型的参数具体包括：
将所述融合损失函数进行梯度回传，结合梯度反向传播更新所述细分类识别模型的所述参数，使所述细分类识别模型达到最优点，完成对所述细分类识别模型的训练。

7.根据权利要求1-6中任意一项所述的基于信息熵的细分类识别模型训练...

【专利技术属性】
技术研发人员：艾江波，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人