【技术实现步骤摘要】
深度学习网络模型的训练方法、相关装置及存储介质
[0001]本申请涉及计算机
,特别涉及一种深度学习网络模型的训练方法、相关装置及存储介质。
技术介绍
[0002]目前的深度学习网络模型在训练的过程中,通常采用正方形的图像作为输入,若输入的图像并非正方形,则需要将图像的短边进行填充后,使图像变成正方形后,再输入至深度学习网络模型中进行训练,从而得到训练后的深度学习网络模型。
[0003]因此,在后续对训练后的深度学习网络模型进行应用的过程中,训练后的深度学习网络模型所属的设备需要将图像进行填充后,再输入至训练后的深度学习网络模型中,得到输出结果。可以理解的是,将图像进行填充的操作,一定会增加图像的像素数量,从而会增加训练后的深度学习网络模型的计算量,进而降低训练后的深度学习网络模型所属的设备的计算利用率。
技术实现思路
[0004]有鉴于此,本申请提供一种深度学习网络模型的训练方法、相关装置及存储介质,用于提高训练后的深度学习网络模型在实际的应用过程中,训练后的深度学习网络模型所属的设备的计算利用率。
[0005]本申请第一方面提供了一种深度学习网络模型的训练方法,包括:
[0006]获取至少一个训练样本图像以及所述训练样本图像对应的真实结果;
[0007]分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域;其中,所述目标子区域的分辨率为目标分辨率;所述目标分辨率为深度学习网络模型所适配的分辨率;
[0008]将所述目标 ...
【技术保护点】
【技术特征摘要】
1.一种深度学习网络模型的训练方法,其特征在于,包括:获取至少一个训练样本图像以及所述训练样本图像对应的真实结果;分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域;其中,所述目标子区域的分辨率为目标分辨率;所述目标分辨率为深度学习网络模型所适配的分辨率;将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果;利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。2.根据权利要求1所述的训练方法,其特征在于,所述对所述第一目标图像进行随机裁剪,得到目标子区域之前,还包括:判断所述训练样本图像的长与宽是否相等;若判断出所述训练样本图像的长与宽不相等,则对所述训练样本图像进行填充,得到填充后的训练样本图像;其中,所述填充后的训练样本图像的长与宽相等;其中,所述分别针对每一个所述训练样本图像进行随机裁剪,得到每一个所述训练样本图像对应的目标子区域,包括:对所述填充后的训练样本图像进行随机裁剪,得到所述填充后的训练样本图像对应的目标子区域。3.根据权利要求1所述的训练方法,其特征在于,所述利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,对所述深度学习网络模型中的参数进行调整,直至调整后的深度学习网络模型输出的所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型,包括:判断所述训练样本图像的预测结果与所述训练样本对应的真实结果之间的误差,是否满足预设的收敛条件;若判断出所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第一损失函数;根据目标学习率和所述第一损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述目标学习率为预设的初始学习率;将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果;判断所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,是否满足预设的收敛条件;若判断出所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,不满足预设的收敛条件,则利用所述训练样本图像的修正后的预测结果与所述训练样本图像对应的真实结果之间的误差,确定第二损失函数;
根据所述调整后的学习率和所述第二损失函数对所述深度学习网络模型中的参数进行调整,得到调整后的深度学习网络模型;其中,所述调整后的学习率小于所述目标学习率;返回执行所述将所述目标子区域输入至所述调整后的深度学习网络模型,得到所述训练样本图像的修正后的预测结果步骤,直至所述调整后的深度学习网络模型输出的所述训练样本图像的修正后的的预测结果与所述训练样本图像对应的真实结果之间的误差,满足预设的收敛条件,将所述调整后的深度学习网络模型作为最终的深度学习网络模型。4.根据权利要求1所述的训练方法,其特征在于,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果之前,还包括:对所述目标子区域进行数据增强,得到多个数据增强后的目标子区域;其中,所述将所述目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果,包括:分别针对每一个所述数据增强后的目标子区域,将所述数据增强后的目标子区域输入至所述深度学习网络模型中的连续多个网络层中,得到所述训练样本图像的预测结果。5.一种深度学习网络模型的训练装置,其...
【专利技术属性】
技术研发人员:古迎冬,李骊,
申请(专利权)人:北京华捷艾米科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。