【技术实现步骤摘要】
模型训练方法、图像类别检测方法、装置和电子设备
本申请实施例涉及计算机
,具体涉及模型训练方法、图像类别检测方法、装置和电子设备。
技术介绍
图像识别,是一种利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。在采用图像识别技术对图像的类别进行检测时,通常可利用机器学习方法训练一个图像类别检测模型,从而使用该模型对待测图像的类别进行检测。现有技术中,在训练图像类别检测模型的过程时,通常采用随机采样方式对样本集中的图像样本进行采样,使各图像样本具有相同的采样概率,进而使用依次采样的图像样本进行图像类别检测模型的训练。然而,样本集中的图像样本通常存在长尾问题,即小部分类别的图像样本数量较多,大部分类别的图像样本数量较少,导致样本集中的不同类别的图像样本数量不均衡。这种情况下,对于图像样本数量较少的类别,无法针对这些类别采样到充分的图像样本,从而导致对这些类别的图像样本的特征学习不够充分,进而造成图像类别检测模型的检测精度较低。
技术实现思路
本申请实施例提出了模型训练方法、图像类别检测方法、装置和电子设备,以提高模型训练过程中的数据利用率,使模型充分学习到各类别的图像样本的特征,从而提升图像类别检测模型的检测精度。第一方面,本申请实施例提供了一种图像类别检测模型的训练方法,该方法包括:获取样本集,样本集包括具有类别标注的图像样本;基于各类别的图像样本的数量,确定各类别的图像样本的目标采样概率,其中,各类别的图像样本的数量与目标采样概率呈反比;分别以
【技术保护点】
1.一种图像类别检测模型的训练方法,其特征在于,所述方法包括:/n获取样本集,所述样本集包括具有类别标注的图像样本;/n基于各类别的图像样本的数量,确定各类别的图像样本的目标采样概率,其中,各类别的图像样本的数量与目标采样概率呈反比;/n分别以随机采样方式和基于所述目标采样概率的采样方式,采样所述样本集中的图像样本,并执行如下训练步骤:将以不同采样方式采样的图像样本输入至包含双分支网络的初始模型中的不同分支网络,得到所述初始模型输出的类别检测结果;基于所述类别检测结果和所采样的图像样本的类别标注,确定损失值,并基于所述损失值更新所述初始模型中的参数;当所述初始模型训练完成时,将训练后的初始模型确定为图像类别检测模型。/n
【技术特征摘要】
1.一种图像类别检测模型的训练方法,其特征在于,所述方法包括:
获取样本集,所述样本集包括具有类别标注的图像样本;
基于各类别的图像样本的数量,确定各类别的图像样本的目标采样概率,其中,各类别的图像样本的数量与目标采样概率呈反比;
分别以随机采样方式和基于所述目标采样概率的采样方式,采样所述样本集中的图像样本,并执行如下训练步骤:将以不同采样方式采样的图像样本输入至包含双分支网络的初始模型中的不同分支网络,得到所述初始模型输出的类别检测结果;基于所述类别检测结果和所采样的图像样本的类别标注,确定损失值,并基于所述损失值更新所述初始模型中的参数;当所述初始模型训练完成时,将训练后的初始模型确定为图像类别检测模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述初始模型训练完成前,重新以所述不同采样方式采样所述样本集中的图像样本,并使用更新参数后的初始模型和所重新采样的图像样本,继续执行所述训练步骤。
3.根据权利要求1所述的方法,其特征在于,所述基于各类别的图像样本的数量,确定各类别的图像样本的目标采样概率,包括:
统计所述样本集中各类别的图像样本的数量;
确定所统计的数量中的最大值与各类别的图像样本的数量的比值;
对所确定的各比值进行求和,得到求和结果;
对于每一个类别,将该类别的图像样本的数量与所述求和结果的比值,作为该类别的图像样本的目标采样概率。
4.根据权利要求1所述的方法,其特征在于,所述双分支网络包括第一分支网络和第二分支网络,第一分支网络包括第一特征提取网络和第一分类器,所述第二分支网络包括第二特征提取网络和第二分类器;以及,
所述将以不同采样方式采样的图像样本输入至包含双分支网络的初始模型中的不同分支网络,得到所述初始模型输出的类别检测结果,包括:
将以随机采样方式采样的图像样本输入至所述第一特征提取网络,得到第一特征信息,并将基于所述采样概率采样的图像样本输入至所述第二特征提取网络,得到第二特征信息;
分别对所述第一特征信息和所述第二特征信息进行加权;
将加权后的第一特征信息输入至所述第一分类器,得到第一分类结果,并将加权后的第二特征信息输入至所述第二分类器,得到第二分类结果;
将所述第一分类结果和所述第二分类结果进行融合,输出类别检测结果。
5.根据权利要求4所述的方法,其特征在于,所述分别对所述第一特征信息和所述第二特征信息进行加权,包括:
确定当前训练的周期数和预设的周期总数;
确定所述周期数与所述周期总数的比值的平方数;
将所述平方数作为所述第二特征信息的权重,将预设数值与所述权重的差值作为所述第一特征信息的权重,分别对所述第一特征信息和所述第二特征信息进行加权。
6.根据权利要求4所述的方法,其特征在于,所述第一分类结果和所述第二分类结果均为向量;以及,
所述将所述第一分类结果和所述第二分类结果进行融合,得到所述初始模型输出的类别检测结果,包括:
将所述第一分类结果和所述第二分类结果按元素相加,得到目标向量;
将所述目标向量输入至预设的归一化指数函数,得到类别检测结果。
7.根据权利要求4所述的方法,其特征在于,所述第一特征提取网络和所述第二特征提取网络分别包括隐藏层、残差层和全局平均池化层,所述隐藏层包括至少一个卷积层,所述第一特征提取网络的隐藏层和所述第二特征提取网络的隐藏层的参数共享。
8.根据权利要求4所述的方法,其特征在于,所述基于所述类别检测结果和所采样的图像样本的类别标注,确定损失值,包括:
将所述类别检测结果和以随机采样...
【专利技术属性】
技术研发人员:周博言,魏秀参,崔权,
申请(专利权)人:北京迈格威科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。