一种基于神经网络的目标分类模型的优化方法、装置制造方法及图纸

技术编号:24208731 阅读:46 留言:0更新日期:2020-05-20 15:51
本发明专利技术公开了一种基于神经网络的目标分类模型的优化方法、装置。该方法包括:构建基于神经网络的目标分类模型,对目标分类模型进行训练,利用训练好的目标分类模型实现目标图像的分类;当出现新的目标图像,该新的目标图像为针对目标新情况对应的图像且仍可分类到原分类体系中,判断目标分类模型对所述新的目标图像的分类识别结果,若目标分类模型无法对新的目标图像进行正确分类,则根据新的目标图像选取部分参数,对部分参数进行调整,经训练得到能够将新的目标图像正确分类的目标分类模型。上述方案可以在保证目标分类模型性能的基础上使其能够适应新的场景,且训练速度获得极大的提高,在20分钟左右即可完成模型训练。

An optimization method and device of target classification model based on Neural Network

【技术实现步骤摘要】
一种基于神经网络的目标分类模型的优化方法、装置
本专利技术涉及机器视觉
,具体涉及一种基于神经网络的目标分类模型的优化方法、装置、电子设备和可读存储介质。
技术介绍
随着深度学习的发展,人工智能(AI)在智能制造领域的作用越来越大,在很多实际工程部署当中,人工智能在质量把控、缺陷类型检测等方面起到了巨大的作用。而随着基于深度学习的人工智能发展,人工智能模型越来越大,训练越来越难。往往在单块图形处理器(GPU)上进行一次模型训练需要三小时及以上的时间。但是在实际生产的缺陷检测应用当中,以小时为单位的模型更新速度难以适应生产线某些突发需求,如当前批次的产品和之前产品的数据分布不同,产生了较多的漏检,而模型不能快速适应这种变化。这种需求变化需要模型在很短时间内快速适应,而当前的模型训练至少需要1-2小时,远不能满足需求。因此,需要设计一种实现快速训练模型优化方案。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于神经网络的目标分类模型的优化方法、装置、电子设备和本文档来自技高网...

【技术保护点】
1.一种基于神经网络的目标分类模型的优化方法,其特征在于,所述方法包括:/n构建基于神经网络的所述目标分类模型,对所述目标分类模型进行训练,利用训练好的目标分类模型实现目标图像的分类;/n当出现新的目标图像,所述新的目标图像为针对目标新情况对应的图像且仍可分类到原分类体系中,判断所述目标分类模型对所述新的目标图像的识别结果,若所述目标分类模型无法对新的目标图像进行正确分类,则根据新的目标图像选取部分参数,对所述部分参数进行调整,经训练得到能够将新的目标图像正确分类的目标分类模型。/n

【技术特征摘要】
1.一种基于神经网络的目标分类模型的优化方法,其特征在于,所述方法包括:
构建基于神经网络的所述目标分类模型,对所述目标分类模型进行训练,利用训练好的目标分类模型实现目标图像的分类;
当出现新的目标图像,所述新的目标图像为针对目标新情况对应的图像且仍可分类到原分类体系中,判断所述目标分类模型对所述新的目标图像的识别结果,若所述目标分类模型无法对新的目标图像进行正确分类,则根据新的目标图像选取部分参数,对所述部分参数进行调整,经训练得到能够将新的目标图像正确分类的目标分类模型。


2.如权利要求1所述的方法,其特征在于,所述则根据新的目标图像选取部分参数,对所述参数进行调整,得到能够将新的目标图像正确分类的目标分类模型包括如下的一种或两种:
选取对所述新的目标图像分类的标签值,根据所述目标分类模型中损失函数的类别调整所述标签值;
对新的目标图像的数据样本进行误差计算,获取所述目标分类模型中各参数的梯度值,根据所述梯度值的大小选取部分参数,然后更新所述部分参数。


3.如权利要求2所述的方法,其特征在于,所述选取对所述新的目标图像分类的标签值,根据所述目标分类模型中损失函数的类别调整所述标签值包括:
若所述目标分类模型中的损失函数为focal_loss函数,则将主类别标签值设置为第一数值范围内的第一值,次类别标签值为0;
若损失函数为除focal_loss函数外的其他损失函数,则将主类别标签值设置为第二数值范围内的第二值,次类别标签值为1与所述第二值的差值相对于次类别标签个数的平均值;
其中所述第一数值范围和第二数值范围均为(0.5-1)的子集。


4.如权利要求1所述的方法,其特征在于,所述对新的目标图像的数据样本进行误差计算,获取所述目标分类模型中各参数的梯度值,根据所述梯度值的大小选取部分参数,然后更新所述部分参数包括:
选取梯度值大于预设阈值的部分参数或梯度值降序排列时从高到低的预设比例范围内的部分参数,对该部分参数进行包括如下的任一种或几种方式的更新:
仅对全连接层中的所述部分参数进行更新;
对全连接层和1*1卷积层中的所述部分参数进行更新;
对全连接层和全部尺寸卷积层的所述部分参数进行更新。


5.如权利要求4所述的方法,其特征在于,所述选取梯度值降序排列时从高到低的预设比例范围内的部分参数还包括:
反向传播时将各参数的梯度值从高到低降序排列,选取5%-10%范围的梯度值对应的部分参数,对该部分参数进行更新;
设置小于预设阈值的学习率,以防止所述目标分类模型过拟合。


6.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
在所述目标分类模型的主分类首次输出确定性检出结果时或者输出确定性检出结果的次数大于预定次数时,即停止利用所述新的目标图像对所述目标分类模型的训练。


7.如权利要求6所述的方法,其特征在于,所述经训练得到能够将新的目标图像正确分类的目标分类模型还包括:<...

【专利技术属性】
技术研发人员:邸顺然张一凡刘杰田继锋
申请(专利权)人:歌尔股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1