深度学习网络模型的训练方法、相关装置及存储介质制造方法及图纸

技术编号:28225602 阅读:15 留言:0更新日期:2021-04-28 09:59
本申请提供了一种深度学习网络模型的训练方法、相关装置及存储介质,本申请在对深度学习网络模型进行训练时,利用随机裁剪后的训练样本图像对深度学习网络模型进行训练,从而在将最终的深度学习网络模型进行实际应用时,最终的深度学习网络模型所属的设备不再需要对图像进行裁剪、填充等操作后,再输入至最终的深度学习网络模型中,最终的深度学习网络模型所属的设备直接将图像输入至最终的深度学习网络模型即可,从而增加了最终的深度学习网络模型所属的设备计算利用率。络模型所属的设备计算利用率。络模型所属的设备计算利用率。

【技术实现步骤摘要】
深度学习网络模型的训练方法、相关装置及存储介质


[0001]本申请涉及计算机
,特别涉及一种深度学习网络模型的训练方法、相关装置及存储介质。

技术介绍

[0002]目前的深度学习网络模型在训练的过程中,通常采用正方形的图像作为输入,若输入的图像并非正方形,则需要将图像的短边进行填充后,使图像变成正方形后,再输入至深度学习网络模型中进行训练,从而得到训练后的深度学习网络模型。
[0003]因此,在后续对训练后的深度学习网络模型进行应用的过程中,训练后的深度学习网络模型所属的设备需要将图像进行填充后,再输入至训练后的深度学习网络模型中,得到输出结果。可以理解的是,将图像进行填充的操作,一定会增加图像的像素数量,从而会增加训练后的深度学习网络模型的计算量,进而降低训练后的深度学习网络模型所属的设备的计算利用率。

技术实现思路

[0004]有鉴于此,本申请提供一种深度学习网络模型的训练方法、相关装置及存储介质,用于提高训练后的深度学习网络模型在实际的应用过程中,训练后的深度学习网络模型所属的设备的计算利用率。
[0005]本申请第一方面提供了一种深度学习网络模型的训练方法,包括:
[0006]获取至少一个训练样本图像以及所述训练样本图像对应的真实结果;
[0007]分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域;其中,所述目标子区域的分辨率为目标分辨率;所述目标分辨率为深度学习网络模型所适配的分辨率;
[0008]将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果;
[0009]利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。
[0010]可选的,所述对所述第一目标图像进行随机裁剪,得到目标子区域之前,还包括:
[0011]判断所述训练样本图像的长与宽是否相等;
[0012]若判断出所述训练样本图像的长与宽不相等,则对所述训练样本图像进行填充,得到填充后的训练样本图像;其中,所述填充后的训练样本图像的长与宽相等;
[0013]其中,所述分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域,包括:
[0014]对所述填充后的训练样本图像进行随机裁剪,得到所述填充后的训练样本图像对
应的目标子区域。
[0015]可选的,所述利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型,包括:
[0016]判断所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,是否满足预设的收敛条件;
[0017]若判断出所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第一损失函数;
[0018]根据目标学习率和所述第一损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述目标学习率为预设的初始学习率;
[0019]将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果;
[0020]判断所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,是否满足预设的收敛条件;
[0021]若判断出所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第二损失函数;
[0022]根据所述调整后的学习率和所述第二损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述调整后的学习率小于所述目标学习率;
[0023]返回执行所述将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果步骤,直至所述调整后的深度学习网络模型输出的所述训练样本图像的修正后的的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。
[0024]可选的,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果之前,还包括:
[0025]对所述目标子区域进行数据增强,得到多个数据增强后的目标子区域;
[0026]其中,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果,包括:
[0027]分别针对每一个所述数据增强后的目标子区域,将所述数据增强后的目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果。
[0028]本申请第二方面提供了一种深度学习网络模型的训练装置,包括:
[0029]获取单元,用于获取至少一个训练样本图像以及所述训练样本图像对应的真实结果;
[0030]裁剪单元,用于分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所
述训练样本图像对应的目标子区域;其中,所述目标子区域的分辨率为目标分辨率;所述目标分辨率为深度学习网络模型所适配的分辨率;
[0031]第一输入单元,用于将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果;
[0032]模型确定单元,用于利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。
[0033]可选的,所述深度学习网络模型的训练装置,还包括:
[0034]第一判断单元,用于判断所述训练样本图像的长与宽是否相等;
[0035]填充单元,用于若所述第一判断单元判断出,所述训练样本图像的长与宽不相等,则对所述训练样本图像进行填充,得到填充后的训练样本图像;其中,所述填充后的训练样本图像的长与宽相等;
[0036]其中,所述裁剪单元用于:
[0037]对所述填充后的训练样本图像进行随本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习网络模型的训练方法,其特征在于,包括:获取至少一个训练样本图像以及所述训练样本图像对应的真实结果;分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域;其中,所述目标子区域的分辨率为目标分辨率;所述目标分辨率为深度学习网络模型所适配的分辨率;将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果;利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。2.根据权利要求1所述的训练方法,其特征在于,所述对所述第一目标图像进行随机裁剪,得到目标子区域之前,还包括:判断所述训练样本图像的长与宽是否相等;若判断出所述训练样本图像的长与宽不相等,则对所述训练样本图像进行填充,得到填充后的训练样本图像;其中,所述填充后的训练样本图像的长与宽相等;其中,所述分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域,包括:对所述填充后的训练样本图像进行随机裁剪,得到所述填充后的训练样本图像对应的目标子区域。3.根据权利要求1所述的训练方法,其特征在于,所述利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型,包括:判断所述训练样本图像的预测结果与所述训练样本对应的真实结果之间的误差,是否满足预设的收敛条件;若判断出所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第一损失函数;根据目标学习率和所述第一损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述目标学习率为预设的初始学习率;将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果;判断所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,是否满足预设的收敛条件;若判断出所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第二损失函数;
根据所述调整后的学习率和所述第二损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述调整后的学习率小于所述目标学习率;返回执行所述将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果步骤,直至所述调整后的深度学习网络模型输出的所述训练样本图像的修正后的的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。4.根据权利要求1所述的训练方法,其特征在于,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果之前,还包括:对所述目标子区域进行数据增强,得到多个数据增强后的目标子区域;其中,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果,包括:分别针对每一个所述数据增强后的目标子区域,将所述数据增强后的目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果。5.一种深度学习网络模型的训练装置,其...

【专利技术属性】
技术研发人员:古迎冬李骊
申请(专利权)人:北京华捷艾米科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1