【技术实现步骤摘要】
网络模型的训练方法、训练装置及计算机可读存储介质
[0001]本申请涉及图像处理
,特别是涉及网络模型的训练方法、训练装置及计算机可读存储介质。
技术介绍
[0002]在图像处理
,通常使用训练好的网络模型进行图像处理。如利用网络模型进行图像识别以及图像分割等任务,因此,网络模型对图像处理的准确度尤为重要。
[0003]在深度学习领域,针对不同的任务,研究人员需要手工设计具体的网络模型的网络结构,如神经网络结构。其中,卷积神经网络的架构包含卷积核的尺寸和数量,池化或下采样的尺寸及次数,网络层数,跨层连接等超参数,随着网络层数逐渐加深,可能的网络结构数量也呈指数级增长,研究人员往往只能根据经验和反复试验才能设计出一个适应具体任务且性能良好的神经网络结构,这一过程十分耗时费力且不一定能找到最适合该任务的网络结构。
[0004]相关技术中采用神经网络架构搜索的方式进行网络架构的自我搜索,但是搜索出来的网络模型性能较差,还不能满足网络模型对图像处理的准确度要求。
技术实现思路
[0005] ...
【技术保护点】
【技术特征摘要】
1.一种网络模型的训练方法,其特征在于,所述网络模型用于图像处理,所述训练方法包括:利用训练样本对网络模型集合中的多个网络模型进行多次迭代训练至满足训练停止条件;所述多次迭代中的第i次迭代训练包括:利用所述训练样本对所述网络模型集合中的多个网络模型进行基础训练,得到多个训练后的网络模型;其中,所述i为大于1的整数;对至少两个第一目标网络模型进行交叉修正,得到对应数量的第二目标网络模型;所述第一目标网络模型为所述多个训练后的网络模型中的网络模型;利用所述对应数量的第二目标网络模型更新所述网络模型集合。2.根据权利要求1所述的方法,其特征在于,所述利用所述对应数量的第二目标网络模型更新所述网络模型集合,包括:利用各个所述第二目标网络模型,替换所述网络模型集合中对应的所述第一目标网络模型。3.根据权利要求1所述的方法,其特征在于,所述网络模型包括多个结构块,每个所述结构块包括按照目标连接方式连接的节点,其中,所述目标连接方式包括除串联之外的连接方式。4.根据权利要求1所述的方法,其特征在于,所述对至少两个第一目标网络模型进行交叉修正,得到对应数量的第二目标网络模型之前,还包括:确定所述多个训练后的网络模型中每一网络模型的适应度;基于确定的各个所述适应度,从所述多个训练后的网络模型中确定出所述至少两个第一目标网络模型。5.根据权利要求4所述的方法,其特征在于,所述基于确定的各个所述适应度,从所述多个训练后的网络模型中确定出所述至少两个第一目标网络模型,包括:将所述适应度小于设定阈值的训练后的网络模型,确定为所述第一目标网络模型;和/或,按照所述适应度的大小,将所述多个训练后的网络模型中的所有网络模型进行排序,并将排序在目标序列位置的网络模型确定为所述第一目标网络模型。6.根据权利要求1所述的方法,其特征在于,所述对所述至少两个第一目标网络模型进行交叉修正,得到对应数量的第二目标网络模型,包括:将每两个第一目标网络模型进行交叉操作,更新每一所述第一目标网络模型的连接结构;对更新后的第一目标网络模型进行变异操作,再次更新所述第一目标网络模型的连接结构,得到所述第二目标网络模型。7.根据权利要求6所述的方法,其特征在于,所述将每两个第一目标网络模型进行交叉操作之前,包括:确定所述多个训练后的网络模型中每一网络模型的适应度;以及,确定所有适应度中的最大适应度以及所有适应度的平均适应度;确定每两个第一目标网络模型的适应度中较大的适应度为目标适应度;
利用所述目标适应度、所述最大适应度和平均适应度确定交叉率;所述将每两个第一目标网络模型进行交叉操作,包括:按照所述交叉率将每两个第一目标网络模型进行交叉操作。8.根据权利要求6所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:蒋伟,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。