【技术实现步骤摘要】
梯度参数确定方法、装置及计算机可读存储介质
本公开涉及图像处理
,尤其涉及一种梯度参数确定方法、装置及计算机可读存储介质。
技术介绍
随着图像处理技术的快速发展,卷积神经网络模型在图像识别方面得到了广泛的应用,譬如,如果将一张待识别的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别。例如,将一张“猫”的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别为“猫”。为了能够成功实现图像识别,通常需要预先基于训练图像对卷积神经网络模型进行训练,卷积神经网络模型一般是由多个卷积层、多个激活层、多个池化层以及多个全连接层串联组成。卷积神经网络模型的训练过程包括:在卷积神经网络模型的输入层输入训练图像,通过待训练的卷积神经网络模型对训练图像进行识别后,从输出层输出预测类别概率。之后,基于该预测类别概率与初始类别概率之间的类别概率误差,确定每一层的梯度参数,并基于该每一层的梯度参数对卷积神经网络模型包括每一层的初始模型参数进行调整。在实际实现中,为了增加图像识别的准确性,一般需要对卷积神经网络模型进 ...
【技术保护点】
一种梯度参数确定方法,其特征在于,所述方法包括:通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度,所述指定全连接层位于所述卷积神经网络模型包括的多个卷积层之间的指定位置,所述指定全连接层的下一个卷积层靠近所述卷积神经网络模型的输出层;通过所述指定全连接层确定第二梯度,所述第二梯度是基于第一类别概率误差确定得到,所述第一类别概率误差为第一预测类别概率与初始类别概率之间的误差,所述第一预测类别概率是通过所述卷积神经网络模型中位于所述指定全连接层之上的多层对训练图像进行识别处理后得到;将所述第一梯度与所述第二梯度进行求和运算,得到第三 ...
【技术特征摘要】
1.一种梯度参数确定方法,其特征在于,所述方法包括:通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度,所述指定全连接层位于所述卷积神经网络模型包括的多个卷积层之间的指定位置,所述指定全连接层的下一个卷积层靠近所述卷积神经网络模型的输出层;通过所述指定全连接层确定第二梯度,所述第二梯度是基于第一类别概率误差确定得到,所述第一类别概率误差为第一预测类别概率与初始类别概率之间的误差,所述第一预测类别概率是通过所述卷积神经网络模型中位于所述指定全连接层之上的多层对训练图像进行识别处理后得到;将所述第一梯度与所述第二梯度进行求和运算,得到第三梯度;将所述第三梯度确定为用于训练所述卷积神经网络模型的梯度参数。2.如权利要求1所述的方法,其特征在于,所述通过所述指定全连接层确定第二梯度,包括:通过所述卷积神经网络模型中位于所述指定全连接层之上的多层对所述训练图像进行识别处理,得到所述第一预测类别概率;确定所述第一预测类别概率与所述初始类别概率之间的差值,得到所述第一类别概率误差;基于所述第一类别概率误差,通过所述指定全连接层采用指定梯度下降法确定所述第二梯度。3.如权利要求1所述的方法,其特征在于,所述通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度之前,还包括:通过所述卷积神经网络模型包括的所有层对所述训练图像进行识别处理,得到第二预测类别概率;确定所述第二预测类别概率与所述初始类别概率之间的差值,得到第二类别概率误差;基于所述第二类别概率误差,通过所述卷积神经网络模型中位于所述指定全连接层的下一个卷积层采用指定梯度下降法确定所述第一梯度。4.如权利要求1所述的方法,其特征在于,所述将所述第三梯度确定为用于训练所述卷积神经网络模型的梯度参数之后,还包括:确定所述第三梯度的梯度长度与指定系数之间的乘积,得到移动步长,并将所述指定全连接层的模型参数,向所述第三梯度的梯度方向移动所述移动步长,所述指定系数为预先设置的任一系数;将所述第三梯度传递给所述指定全连接层的上一个卷积层,以对梯度参数进行传递。5.如权利要求4所述的方法,其特征在于,当所述卷积神经网络模型包括的模型参数为初始模型参数时,所述初始模型参数为预先设置的任一参数。6.一种梯度参数确定装置,其特征在于,所述装置包括:接收模块,用于通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度,所述...
【专利技术属性】
技术研发人员:万韶华,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。