【技术实现步骤摘要】
基于小型训练集的图像深度学习网络构建方法及装置
本专利技术涉及人工智能的模型托管
,尤其涉及一种基于小型训练集的图像深度学习网络构建方法、装置、计算机设备及存储介质。
技术介绍
目前,深度卷积神经网络在图像分类、图像检测、图像分割等的多个任务的公开数据集上都能取得的较好的效果,其中一个重要原因是有大量的训练数据来确保模型训练效果。在大量数据保证的前提下,深度卷积神经网络可以通过加深网络深度、加大模型参数量的方式来提高模型的精度。在有大量数据时,深度卷积神经网络甚至可以做到超过人眼的水平,但应用到实际场景中时,由于收集实际数据和标注数据的成本过高,训练出一个可以实际应用的网络往往很难。现有的降低收集实际数据和实际标注量的方法主要是通过模型预训练的方式。模型预训练是指,一个模型在一个比较大的公开数据集训练之后,再在特定的小数据集的任务上微调训练。但模型预训练存在着网络参数遗忘的问题,因为在特定的小数据集上微调训练的过程中,大数据集里的数据对此时的网络是不可见的。
技术实现思路
本专利技术实施例提 ...
【技术保护点】
1.一种基于小型训练集的图像深度学习网络构建方法,其特征在于,包括:/n接收当前小型图片训练集,调用显存大小值,根据所述当前小型图片训练集中单张图片内存值以及所述显存大小值计算得到批量输入图片张数,根据所述当前小型图片训练集中训练集图片总张数以及所述批量输入图片张数计算得到图片总批次值;其中,所述当前小型图片训练集中包括实际数据图片和额外数据图片;/n获取所述当前小型图片训练集中的当前批量输入图片;其中,所述当前批量输入图片对应的图片批次值的初始值为1,所述当前批量输入图片中包括实际数据图片和额外数据图片;/n将所述当前批量输入图片中包括的实际数据图片和额外数据图片分别输入 ...
【技术特征摘要】
1.一种基于小型训练集的图像深度学习网络构建方法,其特征在于,包括:
接收当前小型图片训练集,调用显存大小值,根据所述当前小型图片训练集中单张图片内存值以及所述显存大小值计算得到批量输入图片张数,根据所述当前小型图片训练集中训练集图片总张数以及所述批量输入图片张数计算得到图片总批次值;其中,所述当前小型图片训练集中包括实际数据图片和额外数据图片;
获取所述当前小型图片训练集中的当前批量输入图片;其中,所述当前批量输入图片对应的图片批次值的初始值为1,所述当前批量输入图片中包括实际数据图片和额外数据图片;
将所述当前批量输入图片中包括的实际数据图片和额外数据图片分别输入至初始深度卷积神经网络的卷积层进行卷积,得到与各张实际数据图片对应的第一输出矩阵以组成第一输出矩阵集合,和与各张额外数据图片对应的第二输出矩阵以组成第二输出矩阵集合;
将所述第一输出矩阵集合中各个第一输出矩阵均输入至初始深度卷积神经网络的批归一化层进行批归一化处理,得到与所述第一输出矩阵集合对应的第一批归一化处理结果;
将所述第二输出矩阵集合中各个第二输出矩阵均输入至初始深度卷积神经网络的的附加批归一化层,得到与所述第二输出矩阵集合对应的第二批归一化处理结果;
将所述第一批归一化处理结果和所述第二批归一化处理结果输入至初始深度卷积神经网络的RELU激活函数层进行激活,得到与所述当前批量输入图片对应的输出结果;
根据初始深度卷积神经网络获取与所述输出结果对应的预测值,根据所述当前批量输入图片对应的实际值与预测值,获取对应的当前损失函数值;
获取已存储的上一批量输入图片对应的上一损失函数值,判断所述当前损失函数值是否小于所述上一损失函数值;
若所述当前损失函数值小于所述上一损失函数值,获取当前批量输入图片中实际数据图片对应的第一实际张数和额外数据图片对应的第二实际张数,以作为下一批量输入图片的图片张数选取参数;
将图片批次值加一以更新图片批次值,将当前小型图片训练集中的当前批量输入图片删除以更新当前小型图片训练集,判断图片批次值是否超出图片总批次值;若图片批次值未超出所述图片总批次值,返回执行所述获取所述当前小型图片训练集中的当前批量输入图片的步骤;以及
若图片批次值超出所述图片总批次值,获取与所述初始深度卷积神经网络对应的当前深度卷积神经网络,以作为目标深度卷积神经网络。
2.根据权利要求1所述的基于小型训练集的图像深度学习网络构建方法,其特征在于,所述根据所述当前小型图片训练集中单张图片内存值以及所述显存大小值计算得到批量输入图片张数,包括:根据所述显存大小值与所述当前小型图片训练集中单张图片内存值之商对应获取批量输入图片张数;
所述根据所述当前小型图片训练集中训练集图片总张数以及所述批量输入图片张数计算得到图片总批次值,包括:根据所述当前小型图片训练集对应的训练集图片总张数与所述批量输入图片张数之商对应获取图片总批次值。
3.根据权利要求1所述的基于小型训练集的图像深度学习网络构建方法,其特征在于,所述获取所述当前小型图片训练集中的当前批量输入图片,包括:
获取所述当前小型图片训练集中所述实际数据图片对应的第一总图片张数,以及所述额外数据图片对应的第二总图片张数;
根据所述第一总图片张数与所述第二总图片张数之商,计算得到图片比值;
判断所述图片比值是否小于0.01;
若图片比值小于0.01,自动将实际数据图片对应的张数设置为p1,且将额外数据图片对应的张数设置为q1;其中,p1+q1=批量输入图片张数,且p1小于q1;
若图片比值的取值范围是[0.01,100],自动将实际数据图片对应的张数设置为p2,且将额外数据图片对应的张数设置为q2;其中,p2+q2=批量输入图片张数,且p2等于q2;
若图片比值大于100,自动将实际数据图片对应的张数设置为p3,且将额外数据图片对应的张数设置为q3;其中,p3+q3=批量输入图片张数,且p3大于q3;
根据实际数据图片对应的张数和额外数据图片对应的张数,在所述当前小型图片训练集中获取对应张数的实际数据图片和额外数据图片以组成当前批量输入图片。
4.根据权利要求1所述的基于小型训练集的图像深度学习网络构建方法,其特征在于,所述将所述第二输出矩阵集合中各个第二输出矩阵均输入至初始深度卷积神经网络的的附加批归一化层,得到与所述第二输出矩阵集合对应的第二批归一化处理结果,包括:
获取第二输出矩阵集合对应的第二输出矩阵均值;
获取第二输出矩阵集合对应的第二输出矩阵方差;
根据所述第二输出矩阵均值和所述第二输出矩阵方差,对所述第二输出矩阵集合进行归一化,得到对应的归一化第二输出矩阵集合;
根据所述...
【专利技术属性】
技术研发人员:张玉琪,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。