在卷积神经网络模型中确定特征图像的方法和装置制造方法及图纸

技术编号:24421607 阅读:100 留言:0更新日期:2020-06-06 14:23
一种在卷积神经网络模型中确定特征图像的方法和装置,属于模型训练技术领域。所述方法包括:获取卷积神经网络模型中目标处理层的多个输入图像(S210);获取目标处理层的至少一组卷积核(S220),其中,同组中的不同卷积核包含的元素相同且元素的排列顺序不同;基于至少一组卷积核中的各卷积核,分别对不同的输入图像进行卷积计算,得到多个中间矩阵,对多个中间矩阵求和得到特征图像(S230)。所述方法通过不同卷积核包含的元素相同但元素的排列顺序不同的特性,减少存储卷积核占用的资源,减少读取卷积核的次数,减少在卷积层确定特征图像时产生的计算量,以及减少计算过程中消耗的系统运行资源。

Method and device for determining feature image in convolutional neural network model

【技术实现步骤摘要】
【国外来华专利技术】在卷积神经网络模型中确定特征图像的方法和装置
本公开是关于模型训练
,尤其是关于一种在卷积神经网络模型中确定特征图像的方法和装置。
技术介绍
卷积神经网络由卷积层、全连接层、激活函数等组成,单个卷积层的输出包括多个特征图像。在对卷积神经网络模型进行训练的过程中,需要对大量的样本进行计算。其中,在卷积层产生的计算量就占整个训练过程中总计算量的90%。对于任意一个卷积层,可以根据输入图像的数量和输出的特征图像的数量,确定卷积核的数量,并生成相应数量的卷积核,每个卷积核可以是一个小矩阵,如3×3矩阵,每个输入图像可以认为是一个大矩阵。该卷积层的处理可以如下:将一个输入图像和一个卷积核进行卷积计算,具体地,在输入图像中提取所有与卷积核大小相同的矩阵,将提取的矩阵与卷积核进行对位元素相乘再相加,得到一个数值,将得到的所有数值组成一个中间矩阵,每个输入图像与一个卷积核进行卷积计算都可以得到一个中间矩阵,这些中间矩阵相加可以得到一个特征图像。在实现本公开的过程中,专利技术人发现至少存在以下问题:由于卷积神经网络包含卷积层的数量较多,每个本文档来自技高网...

【技术保护点】
一种在卷积神经网络模型中确定特征图像的方法,其特征在于,所述方法包括:/n获取卷积神经网络模型中目标处理层的多个输入图像;/n获取所述目标处理层的至少一组卷积核,其中,同组中的不同卷积核包含的元素相同且元素的排列顺序不同;/n基于所述至少一组卷积核中的各卷积核,分别对不同的输入图像进行卷积计算,得到多个中间矩阵,对所述多个中间矩阵求和得到特征图像,其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。/n

【技术特征摘要】
【国外来华专利技术】一种在卷积神经网络模型中确定特征图像的方法,其特征在于,所述方法包括:
获取卷积神经网络模型中目标处理层的多个输入图像;
获取所述目标处理层的至少一组卷积核,其中,同组中的不同卷积核包含的元素相同且元素的排列顺序不同;
基于所述至少一组卷积核中的各卷积核,分别对不同的输入图像进行卷积计算,得到多个中间矩阵,对所述多个中间矩阵求和得到特征图像,其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。


根据权利要求1所述的方法,其特征在于,所述对所述多个中间矩阵求和得到特征图像,包括:
将所述多个中间矩阵中相同位置的元素的多项式相加,得到所述特征图像的每个元素对应的多项式;
对所述特征图像的每个元素对应的多项式,分别进行合并同类项处理;
对每个合并同类项处理后的多项式,分别求值,得到所述特征图像。


根据权利要求1所述的方法,其特征在于,在获取所述目标处理层的至少一组卷积核之前,所述方法还包括:
随机生成N个卷积核,其中,所述N为预设的组数目;
对所述N个卷积核中的每个卷积核,以行为单位进行元素位移,和/或以列为单位进行元素位移,得到M-1个不同的卷积核,M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核,其中,所述M为预设的组中卷积核的数目。


根据权利要求1所述的方法,其特征在于,每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。


根据权利要求1所述的方法,其特征在于,对所述多个中间矩阵求和得到特征图像之后,所述方法还包括:
当得到所述卷积神经网络模型的输出结果时,根据所述卷积神经网络模型的输出结果和预设的输出结果,确定所述至少一组卷积核中每个卷积核中每个元素的调整值;
将同组中的不同卷积核包含的相同元素的调整值之和,确定为所述相同元素的调整值对应的修正后的调整值;
基于每个元素的修正后的调整值,对各卷积核进行调整。


一种在卷积神经网络模型中确定特征图像的装置,其特征在于,所述装置包括:
获取模块,用于获取卷积神经网络模型中目标处理层的多个输入图像;获取所述目标处理层的至少一组卷积核,其中,同组中的不同卷积核包含的元素相同且元素的排列顺序不同;
确定模块,用于基于所述至少一组卷积核中的各卷积核,分别对不同的输入图像进行卷积计算,得到多个中间矩阵,对所述多个中间矩阵求和得到特征图像,其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。


根据权利要求6所述的装置,其特征在于,所述确定模块用于将所述多个中间矩阵中相同位置的元素的多项式相加,得到所述特征图像的每个元素对应的多项式;对所述特征图像的每个元素对应的多项式,分别进行合并同类项处理;对每个合并同类项处理后的多项式,分别求值,得到所述特征图像。


根据权利要求6所述的装置,其特征在于,所述装置还包括:
生成模块,用于随机生成N个卷积核,其中,所述N为预设的组数目;
位移模块,用于对所...

【专利技术属性】
技术研发人员:胡慧
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1