【技术实现步骤摘要】
一种模型训练方法和图像处理方法
[0001]本申请涉及神经网络和深度学习的
,具体而言,涉及一种模型训练方法和图像处理方法。
技术介绍
[0002]目前,在目标检测和语义分割等图像处理相关领域中,通常是使用深度学习网络对待检测图像进行图像处理的,即使用很多小卷积核(3x3卷积)进行堆叠,让深度学习网络的深度更深从而达到识别出抽象特征的效果。然而,在实践过程中发现,使用很多小卷积核堆叠得到的深度学习网络模型有效感受野比较小,导致使用深度学习网络对待检测图像进行图像处理的精度较低。
技术实现思路
[0003]本申请实施例的目的在于提供一种模型训练方法和图像处理方法,用于改善使用深度学习网络对待检测图像进行图像处理的精度较低的问题。
[0004]第一方面,本申请实施例提供了一种模型训练方法,包括:对图像识别神经网络进行训练,获得图像识别模型,图像识别神经网络是由至少一个卷积基本模块构建的,卷积基本模块包括:第一卷积层和第二卷积层,第一卷积层的卷积核尺寸大于第二卷积层的卷积核尺寸,且第一卷积层的输入和第 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:对图像识别神经网络进行训练,获得图像识别模型,所述图像识别神经网络是由至少一个卷积基本模块构建的,所述卷积基本模块包括:第一卷积层和第二卷积层,所述第一卷积层的卷积核尺寸大于所述第二卷积层的卷积核尺寸,且所述第一卷积层的输入和所述第二卷积层的输入是相同的。2.根据权利要求1所述的方法,其特征在于,所述对图像识别神经网络进行训练,包括:针对所述至少一个卷积基本模块中的每个卷积基本模块,将该卷积基本模块中的第二卷积层的参数矩阵叠加至该卷积基本模块中的第一卷积层的参数矩阵中,并从所述图像识别模型中裁剪掉该卷积基本模块中的第二卷积层,获得裁剪后的图像识别模型。3.根据权利要求2所述的方法,其特征在于,所述将该卷积基本模块中的第二卷积层的参数矩阵叠加至该卷积基本模块中的第一卷积层的参数矩阵中,包括:将所述第一卷积层的参数矩阵与所述第二卷积层的参数矩阵进行同轴对齐,并将对齐后的所述第一卷积层的参数矩阵与所述第二卷积层的参数矩阵直接对位相加。4.根据权利要求1所述的方法,其特征在于,所述卷积基本模块还包括:批量正则化层;所述批量正则化层用于对样本图像的图像特征进行批量正则化处理,所述卷积基本模块的输出是根据所述样本图像的图像特征、所述第一卷积层的输出与所述第二卷积层输出的融合结果共同确定的,所...
【专利技术属性】
技术研发人员:丁霄汉,张祥雨,
申请(专利权)人:北京迈格威科技有限公司深圳旷视金智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。