图像识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号:26792759 阅读:26 留言:0更新日期:2020-12-22 17:08
本申请公开了一种图像识别方法、装置及计算机可读存储介质。其中,方法包括预先将样本图像数据集输入至原始神经网络模型;对原始神经网络模型的每一个卷积层,以样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值,再计算重构误差最小的输入通道组合并裁剪冗余的输入通道,从而得到当前卷积层的压缩结果,最后将各卷积层的压缩结果拼接生成图像识别模型。获取待识别图像,将待识别图像输入至图像识别模型中,并将图像识别模型输出结果作为待识别图像的图像识别结果,有效提高图像识别效率,降低图像识别过程中消耗的计算资源。

【技术实现步骤摘要】
图像识别方法、装置及计算机可读存储介质
本申请涉及图像处理
,特别是涉及一种图像识别方法、装置及计算机可读存储介质。
技术介绍
随着人工智能技术的快速发展,机器视觉作为人工智能的一个分支,也得到相应的发展。简单来说,机器视觉就是用机器代替人眼进行测量和判断,其通过机器视觉产品即图像摄取装置如CMOS和CCD等将被摄取目标转换成图像信号,传送给专用图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作,可见,机器视觉在实现过程中很大一部分工作就是图像处理,对图像摄取装置采集图像的识别准确程度和识别效率对机器视觉性能有很大影响。相关技术中,通常采用人工神经网络模型在执行图像识别分类任务,而应用于图像分类识别任务的深度神经网络参数具有很大的冗余性,在执行图像分类识别任务时不仅会消耗大量的计算资源,而且图像识别效率还不高。鉴于此,如何提高图像识别效率,降低图像识别过程中消耗的计算资源,是所属领域技术人员需要解决的技术问题。
技术实现思路
本申请提供了一种图像识别方法、装置及计算机可读存储介质,有效提高图像识别效率,降低图像识别过程中消耗的计算资源。为解决上述技术问题,本专利技术实施例提供以下技术方案:本专利技术实施例一方面提供了一种图像识别方法,包括:预先将样本图像数据集输入至原始神经网络模型;对所述原始神经网络模型的每一个卷积层,以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值,再计算重构误差最小的输入通道组合并裁剪冗余的输入通道,作为所述当前层的压缩结果;将各卷积层的压缩结果拼接生成图像识别模型;将获取的待识别图像输入至所述图像识别模型中,得到所述待识别图像的图像识别结果。可选的,所述以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值包括:根据所述样本图像数据集中各样本数据在所述当前层的各输入通道的特征图确定所述当前层各输入通道的重要性;根据各输入通道的重要性为各输入通道设置重要性加权系数;通过计算各输入通道加权后的重要性函数及其和函数确定每个输入通道的采样概率;按照每个输入通道的采样概率对相应输入通道进行多轮采样,每轮依照所述采样概率对所述当前层的输入通道集合进行多次采样得到一个核集,计算并累加通道核集对应的特征图重构误差,通过计算最小化特征图重构误差的优化函数以获取所述当前层的卷积核权重的更新值。可选的,所述通过计算各输入通道加权后的重要性函数及其和函数确定每个输入通道的采样概率包括:调用预先存储的重要性函数关系式计算各输入通道加权后的重要性函数,所述重要性函数关系式为:si(x)=wi(x)·gi(x);第i个输入通道的采样概率pi为pi=si(x)/t;其中,si(x)为第i个输入通道加权后的重要性函数,wi(x)为第i个输入通道的重要性加权系数,gi(x)为第i个输入通道的初始重要性函数,为所述样本图像数据集X中各样本数据在第i输入通道的特征图xi的Frobenius范数的最大值,ml-1为所述原始神经网络模型的第l-1卷积层的输出通道总数,为所有输入通道的特征图Frobenius范数的最大值的均值,al为所述原始神经网络模型的第l卷积层目标要达到的压缩后输入通道数;t为所述和函数,可选的,所述通过计算最小化特征图重构误差的优化函数以获取所述当前层的卷积核权重的更新值包括:调用预先存储的权值更新关系式得到所述当前层的卷积核权重的更新值,所述权值更新关系式为:式中,Yk为未压缩卷积核在第k输出通道的输出特征图,K为所述当前层卷积核输出通道总数,为对卷积核的K个输出通道分别计算特征图重构误差并汇总,为对输入所述样本图像数据集的输入通道组合进行R轮独立采样并累加每次采样结果的特征图重构误差,代表Frobenius范数,为所述当前层卷积核在第i输入通道和第k输出通道的权重张量的更新值、作为基于核集的卷积核权值估计操作的求解目标,S为输入所述样本图像数据集的C个输入通道中采样到的a个输入通道组成的核集,为核集S中每个输入通道的特征图xi在卷积核对应通道第k个输出通道的输出特征图之和,*为卷积操作。可选的,所述计算重构误差最小的输入通道组合并裁剪冗余的输入通道包括:根据所述当前层卷积核更新后的权值确定所述当前层各输入通道被选中的概率,并将各输入通道被选中的概率组成命中概率集;基于所述命中概率集计算输出特征图重构误差最小的输入通道组合,并根据所述输入通道组合移除未被选择的输入通道;计算压缩后卷积核的输出特征图,以将所述当前层压缩后的卷积核与所述样本图像数据集的卷积结果作为所述当前层的下一个卷积层的输入数据。可选的,所述基于所述命中概率集计算输出特征图重构误差最小的输入通道组合包括:调用预先存储的优化函数关系式计算输出特征图重构误差最小的输入通道组合γ,所述优化函数关系式为:式中,Y为所述原始神经网络模型在所述当前层的输出特征图,K为所述当前层卷积核输出通道总数,γi为第i通道是否被选择,γi取值为0或1,γ={γi|1≤i≤C}为由C个输入通道采样出a个输入通道的最佳采样结果,满足条件||γ||0=a,Xi为所述样本图像数据集在所述当前层的第i输入通道的特征图,为所述当前层卷积核在第i输入通道和第k输出通道的权重张量的更新值,代表Frobenius范数,(1-q)γ为将各个输入通道的采样概率构造的向量作为惩罚因子加入了优化目标函数中的惩罚项,q为所述命中概率集。可选的,所述根据所述当前层卷积核更新后的权值确定所述当前层各输入通道被选中的概率包括:调用预先存储的选择概率关系式计算所述当前层各输入通道被选中的概率,所述选择概率关系式为:式中,wi(x)为第i个输入通道的重要性加权系数,ml-1为所述原始神经网络模型的第l-1卷积层的输出通道总数,X为所述样本图像数据集,xi为所述样本图像数据集中各样本数据在第i输入通道的特征图,K为所述当前层卷积核输出通道总数,为所述当前层卷积核在第i输入通道和第k输出通道的权重张量的更新值,代表Frobenius范数,nl为所述原始神经网络模型在l层的输入通道总数。本专利技术实施例另一方面提供了一种图像识别装置,包括:神经网络模型压缩模块,用于将样本图像数据集输入至原始神经网络模型;对所述原始神经网络模型的每一个卷积层,以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值,再计算重构误差最小的输入通道组合并裁剪冗余的输入通道,作为所述当前层的压缩结果;将各卷积层的压缩结果拼接生成图像识别模型;图像识别模块,用于将获取的待识别图像输入至所述图像识别模型中,得到所述待识别图像的图像识别结果。本专利技术实施本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n预先将样本图像数据集输入至原始神经网络模型;对所述原始神经网络模型的每一个卷积层,以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值,再计算重构误差最小的输入通道组合并裁剪冗余的输入通道,作为所述当前层的压缩结果;将各卷积层的压缩结果拼接生成图像识别模型;/n将获取的待识别图像输入至所述图像识别模型中,得到所述待识别图像的图像识别结果。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
预先将样本图像数据集输入至原始神经网络模型;对所述原始神经网络模型的每一个卷积层,以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值,再计算重构误差最小的输入通道组合并裁剪冗余的输入通道,作为所述当前层的压缩结果;将各卷积层的压缩结果拼接生成图像识别模型;
将获取的待识别图像输入至所述图像识别模型中,得到所述待识别图像的图像识别结果。


2.根据权利要求1所述的图像识别方法,其特征在于,所述以所述样本图像数据集在当前层的特征图为重构目标,利用核集构建方法先获取卷积核的更新权值包括:
根据所述样本图像数据集中各样本数据在所述当前层的各输入通道的特征图确定所述当前层各输入通道的重要性;
根据各输入通道的重要性为各输入通道设置重要性加权系数;
通过计算各输入通道加权后的重要性函数及其和函数确定每个输入通道的采样概率;
按照每个输入通道的采样概率对相应输入通道进行多轮采样,每轮依照所述采样概率对所述当前层的输入通道集合进行多次采样得到一个核集,计算并累加通道核集对应的特征图重构误差,通过计算最小化特征图重构误差的优化函数以获取所述当前层的卷积核权重的更新值。


3.根据权利要求2所述的图像识别方法,其特征在于,所述通过计算各输入通道加权后的重要性函数及其和函数确定每个输入通道的采样概率包括:
调用预先存储的重要性函数关系式计算各输入通道加权后的重要性函数,所述重要性函数关系式为:
si(x)=wi(x)·gi(x);
第i个输入通道的采样概率pi为pi=si(x)/t;
其中,si(x)为第i个输入通道加权后的重要性函数,wi(x)为第i个输入通道的重要性加权系数,gi(x)为第i个输入通道的初始重要性函数,为所述样本图像数据集X中各样本数据在第i输入通道的特征图xi的Frobenius范数的最大值,ml-1为所述原始神经网络模型的第l-1卷积层的输出通道总数,为所有输入通道的特征图Frobenius范数的最大值的均值,al为所述原始神经网络模型的第l卷积层目标要达到的压缩后输入通道数;t为所述和函数,


4.根据权利要求3所述的图像识别方法,其特征在于,所述通过计算最小化特征图重构误差的优化函数以获取所述当前层的卷积核权重的更新值包括:
调用预先存储的权值更新关系式得到所述当前层的卷积核权重的更新值,所述权值更新关系式为:



式中,Yk为未压缩卷积核在第k输出通道的输出特征图,K为所述当前层卷积核输出通道总数,为对卷积核的K个输出通道分别计算特征图重构误差并汇总,为对输入所述样本图像数据集的输入通道组合进行R轮独立采样并累加每次采样结果的特征图重构误差,代表Frobenius范数,为所述当前层卷积核在第i输入通道和第k输出通道的权重张量的更新值、作为基于核集的卷积核权值估计操作的求解目标,S为输入所述样本图像数据集的C个输入通道中采样到的a个输入通道组成的核集,为核集S中每个输入通道的特征图xi在卷积核对应输出通道的输出特征图之和,*为卷积操作。


5.根据权...

【专利技术属性】
技术研发人员:尹文枫董刚赵雅倩
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1