一种图像识别模型的训练方法、装置及电子设备制造方法及图纸

技术编号:23558851 阅读:46 留言:0更新日期:2020-03-25 04:17
本发明专利技术实施例提供了一种图像识别模型的训练方法、装置及电子设备,其中,该方法包括:将获取的已标注图像样本和未标注图像样本输入CNN模型的特征提取层中,分别提取已标注图像样本的特征和未标注图像样本的特征;通过将已标注图像样本的特征和未标注图像样本的特征输入至待训练CNN模型的损失层,获得待训练CNN模型中损失函数的损失值;基于损失函数的损失值对待训练CNN模型中的参数进行调整,得到训练后的CNN模型。这样,采用一部分已标注图像样本和一部分未标注图像样本对CNN模型进行训练,无须采用大量的已标注图像样本对CNN模型进行训练,可以减少人工标注的图像的数量,降低人工标注的工作量,提高模型训练的效率。

A training method, device and electronic equipment of image recognition model

【技术实现步骤摘要】
一种图像识别模型的训练方法、装置及电子设备
本专利技术涉及数据处理
,特别是涉及一种图像识别模型的训练方法、装置及电子设备。
技术介绍
随着深度学习技术的发展,极大的推动了机器视觉技术的应用,例如,将深度学习技术应用于机器视觉领域后,可以使得图像识别、目标检测和实例分割等机器视觉任务的性能显著提高。在应用基于图像识别的机器视觉技术时,通常是先采用已标注的图像作为训练样本对图像识别模型进行训练,然后再采用训练好的图像识别模型处理机器视觉任务。通常情况下,标注图像样本越多,训练的图像识别模型越好,对机器视觉任务处理的精确度也较高。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:在现有技术中,为了训练该图像识别模型,往往需要对大量的图像进行人工标注以得到图像样本,由于人工进行标注比较麻烦,使得人工标注的工作量较大,模型训练的效率低。
技术实现思路
本专利技术实施例的目的在于提供一种图像识别模型的训练方法、装置及电子设备,以实现减少人工标注的图像的数量,降低人工标注的工作量,提高本文档来自技高网...

【技术保护点】
1.一种图像识别模型的训练方法,其特征在于,所述方法包括:/n获取已标注图像样本和未标注图像样本;/n将所述已标注图像样本和所述未标注图像样本输入待训练卷积神经网络CNN模型的特征提取层中,分别提取所述已标注图像样本的特征和所述未标注图像样本的特征;/n通过将所述已标注图像样本的特征和所述未标注图像样本的特征输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值;/n基于所述损失函数的损失值,对所述待训练CNN模型中的参数进行调整,得到训练后的CNN模型。/n

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,所述方法包括:
获取已标注图像样本和未标注图像样本;
将所述已标注图像样本和所述未标注图像样本输入待训练卷积神经网络CNN模型的特征提取层中,分别提取所述已标注图像样本的特征和所述未标注图像样本的特征;
通过将所述已标注图像样本的特征和所述未标注图像样本的特征输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值;
基于所述损失函数的损失值,对所述待训练CNN模型中的参数进行调整,得到训练后的CNN模型。


2.根据权利要求1所述的方法,其特征在于,所述已标注图像样本为标注了类别的图像样本,所述已标注图像样本中的标注对象与所述未标注图像样本不同;
在所述通过将所述已标注图像样本的特征和所述未标注图像样本的特征输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值之前,所述方法还包括:
基于每个类别的所述已标注图像样本的类别,在所述待训练CNN模型对应的权重向量中,确定该已标注图像样本所述类别的权重,其中,所述待训练CNN模型对应的权重向量包括每个类别对应的权重,所述待训练CNN模型对应的权重向量,至少为预先设置的初始权重向量;
所述通过将所述已标注图像样本的特征和所述未标注图像样本的特征输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值,包括:
通过将每个类别的所述已标注图像样本的特征、该已标注图像样本所属类别的权重、所述多个类别的权重和所述未标注图像样本的特征,输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值。


3.根据权利要求2所述的方法,其特征在于,所述通过将每个类别的所述已标注图像样本的特征、该已标注图像样本所属类别的权重、所述多个类别的权重和所述未标注图像样本的特征,输入至所述待训练CNN模型的损失层,获得所述待训练CNN模型中损失函数的损失值,包括:
将第i个已标注图像样本的特征fi、所述第i个已标注图像样本的特征fi所属类别li的权重wli、第j个类别的权重wj以及所述未标注图像样本中第u个未标注图像样本的特征fu,输入至所述待训练CNN模型的损失层,以使得所述损失层通过以下公式:



计算所述待训练CNN模型中损失函数的损失值L,其中,所述n为所述已标注图像样本的总数,所述K为所述已标注图像样本的类别的总数,所述U为所述未标注图像样本的总数,所述wli和所述wj分别为预设权重向量W中的第li列向量和第j列向量,1≤li≤K。


4.根据权利要求1所述的方法,其特征在于,在所述基于所述损失函数的损失值,对所述待训练CNN模型中的参数进行调整,得到训练后的CNN模型之前,所述方法还包括:
基于所述损失函数的损失值判断所述待训练CNN模型是否收敛;
如果是,将所述待训练CNN模型作为训练完成的CNN模型;
如果否,则执行基于所述损失函数的损失值,对所述待训练CNN模型中的参数进行调整,得到训练后的CNN模型的步骤,并将所述训练后的CNN模型作为所述待训练CNN模型,返回执行...

【专利技术属性】
技术研发人员:范音
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1