分类模型的训练方法和图像分类方法、装置、设备和介质制造方法及图纸

技术编号：31799214 阅读：20 留言：0更新日期：2022-01-08 10:59

本公开公开了一种分类模型的训练方法和图像处理方法、装置、电子设备和存储介质，应用于人工智能领域，具体涉及计算机视觉和深度学习领域。分类模型的训练方法的具体实现方案为：将样本图像输入特征提取网络，得到图像特征，该样本图像包括指示真实类别的信息；将图像特征输入类别预测网络，得到第一概率向量，该第一概率向量包括样本图像属于真实类别的预测概率；基于预测概率和类别预测网络的网络权重，对图像特征进行加权处理，得到加权后特征；将加权后特征输入类别预测网络，得到第二概率向量；以及基于第二概率向量，对分类模型进行训练。进行训练。进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型的训练方法和图像分类方法、装置、设备和介质

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习领域，更具体地涉及一种分类模型的训练方法和图像分类方法、装置、设备和介质。

技术介绍

[0002]在图像分类的相关技术中，直接根据损失函数来训练分类模型。在类别较多时，可能会存在因模型无法使真实类别在众多类别中获得关注，导致分类精度不高的技术问题。

技术实现思路

[0003]提供了一种提高模型精度的分类模型的训练方法和图像处理方法、装置、电子设备和存储介质。
[0004]本公开的一个方面提供了一种分类模型的训练方法，分类模型包括特征提取网络和类别预测网络；该训练方法包括：将样本图像输入特征提取网络，得到图像特征，该样本图像包括指示真实类别的信息；将图像特征输入类别预测网络，得到第一概率向量，该第一概率向量包括样本图像属于真实类别的预测概率；基于预测概率和类别预测网络的网络权重，对图像特征进行加权处理，得到加权后特征；将加权后特征输入类别预测网络，得到第二概率向量；以及基于第二概率向量，对分类模型进行训练。
[0005]本公开的另一个方面提供了一种图像分类方法，包括：将待分类图像输入分类模型，得到第三概率向量；以及基于第三概率向量，确定待分类图像的类别，其中，分类模型是采用上文描述的分类模型的训练方法训练得到的。
[0006]本公开的另一个方面提供了一种分类模型的训练装置，其中，分类模型包括特征提取网络和类别预测网络，该装置包括：特征提取模块，用于将样本图像输入特征...

【技术保护点】

【技术特征摘要】
1.一种分类模型的训练方法，其中，所述分类模型包括特征提取网络和类别预测网络；所述方法包括：将样本图像输入所述特征提取网络，得到图像特征，所述样本图像包括指示真实类别的信息；将所述图像特征输入所述类别预测网络，得到第一概率向量，所述第一概率向量包括所述样本图像属于所述真实类别的预测概率；基于所述预测概率和所述类别预测网络的网络权重，对所述图像特征进行加权处理，得到加权后特征；将所述加权后特征输入所述类别预测网络，得到第二概率向量；以及基于所述第二概率向量，对所述分类模型进行训练。2.根据权利要求1所述的方法，其中，所述类别预测网络包括全连接层；对所述图像特征进行加权处理包括：确定所述预测概率在所述第一概率向量中的位置信息；基于所述位置信息，确定表示所述全连接层的网络权重的权重数据中与所述预测概率相关联的目标权重数据；以及基于所述目标权重数据，对所述图像特征进行加权处理。3.根据权利要求2所述的方法，其中，所述基于所述目标权重向量，对所述图像特征进行加权处理包括：对所述目标权重数据进行扩充处理，得到与所述图像特征相同尺寸的权重因子；以及将所述权重因子与所述图像特征点乘，得到所述加权后特征。4.根据权利要求2所述的方法，其中，所述类别预测网络还包括卷积层和分类层；所述将所述图像特征输入所述类别预测网络，得到第一概率向量包括：将所述图像特征输入所述卷积层，得到尺寸小于所述图像特征的低维特征；将所述低维特征输入所述全连接层，得到目标特征；以及将所述目标特征输入所述分类层，得到所述第一概率向量。5.根据权利要求1所述的方法，其中，所述样本图像包括多个图像；所述预测概率包括与所述多个图像分别对应的多个概率；基于所述预测概率和所述类别预测网络的网络权重，对所述图像特征进行加权处理包括：对于所述多个图像中的每个图像，基于所述多个概率中与所述每个图像对应的概率和所述类别预测网络的网络权重，对所述每个图像的图像特征进行加权处理。6.一种图像分类方法，包括：将待分类图像输入分类模型，得到第三概率向量；以及基于所述第三概率向量，确定所述待分类图像的类别，其中，所述分类模型是采用权利要求1～5中任一项所述的方法训练得到的。7.一种分类模型的训练装置，其中，所述分类模型包括特征提取网络和类别预测网络；所述装置包括：特征提取模块，用于将样本图像输入所述特征提取网络，得到图像特征，所述样本图像包括指示真实类别的信息；第一概率预测模块，用于将所述图像特征输入所述类别预测网络，得到第一概率向量，
所述第一概率向量包括所述样本图像属于...

【专利技术属性】
技术研发人员：龚琛婷，谭啸，孙昊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人