卷积神经网络模型轻量化方法及设备、图像识别方法技术

技术编号:30823546 阅读:12 留言:0更新日期:2021-11-18 12:12
本申请公开了一种卷积神经网络模型轻量化方法及设备、图像识别方法及计算机存储介质。该卷积神经网络模型轻量化方法包括:获取原始卷积神经网络模型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于模型参数对初始轻量化模型进行调整,获取卷积神经网络轻量化模型,以基于卷积神经网络轻量化模型对图像进行处理。通过这种方式,能够实现卷积神经网络模型的自适应轻量化处理,以加快其计算速度。以加快其计算速度。以加快其计算速度。

【技术实现步骤摘要】
卷积神经网络模型轻量化方法及设备、图像识别方法


[0001]本申请涉及模式识别
,特别是涉及一种卷积神经网络模型轻量化方法及设备、图像识别方法及计算机存储介质。

技术介绍

[0002]卷积神经网络(Convolutional Neural Networks,CNN)由于其良好的特征提取能力和对特征的不变性,已经成为模式识别领域的基础模型之一。一般来讲,当涉及到对信号进行特征提取的应用,卷积神经网络都能够很好的进行处理。
[0003]传统的卷积神经网络存在许多冗余的特征通道,这些通道对模型的特征提取能力的贡献并不大,甚至还会产生负贡献,在面对大规模数据时,浅层卷积模型拟合能力不足,而加深层数又会导致模型出现过拟合。已有的卷积模型优化方法往往需要在经验下人为设计模型的结构,该设计方式不具有普适性。

技术实现思路

[0004]本申请主要解决的技术问题是如何实现卷积神经网络模型的自适应轻量化处理,以加快其计算速度。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种卷积神经网络模型轻量化方法。该卷积神经网络模型轻量化方法包括:获取原始卷积神经网络模型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于模型参数对初始轻量化模型进行调整,获取卷积神经网络轻量化模型,以基于卷积神经网络轻量化模型对图像进行处理。
[0006]为解决上述技术问题,本申请采用的一个技术方案是:提供一种图像识别方法。该图像识别方法包括:获取原始卷积神经网络模型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于模型参数对初始轻量化模型进行调整,获取卷积神经网络轻量化模型;利用卷积神经网络轻量化模型对图像进行识别。
[0007]为解决上述技术问题,本申请采用的一个技术方案是:提供一种电子设备。该电子设备包括存储器和处理器,存储器与处理器耦接;其中,存储器用于存储程序数据,处理器用于执行程序数据以实现:获取原始卷积神经网络模型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于模型参数对初始轻量化模型进行调整,获取卷积神经网络轻量化模型,以基于卷积神经网络轻量化模型对图像进行处理。
[0008]为解决上述技术问题,本申请采用的一个技术方案是:提供一种计算机存储介质。该计算机存储介质上存储有程序指令,程序指令被执行时实现:获取原始卷积神经网络模
型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于模型参数对初始轻量化模型进行调整,获取卷积神经网络轻量化模型,以基于卷积神经网络轻量化模型对图像进行处理。
[0009]本申请的有益效果是:区别于现有技术,本申请首先通过当前图像识别任务的图像数据集对原始卷积神经网络模型进行训练,然后对训练后的预训练卷积神经网络模型的特征通道进行轻量化处理,无需经验指导,因此能够根据当前识别任务自适应的对卷积神经网络模型进行轻量化处理,减少其模型参数的数量,加快其计算速度,增强其泛化能力;且本申请利用训练后的预训练卷积神经网络模型的模型参数对轻量化处理后的初始轻量化模型进行调整,能够保证调整后的卷积神经网络轻量化模型的准确率。
附图说明
[0010]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
[0011]图1是本申请卷积神经网络模型轻量化方法一实施例的流程示意图;
[0012]图2是图1实施例卷积神经网络模型轻量化方法中步骤S12的具体流程示意图;
[0013]图3是图2实施例中步骤S101的具体流程示意图;
[0014]图4是图3实施例中步骤S22的具体流程示意图;
[0015]图5是图4实施例中步骤S34的具体流程示意图;
[0016]图6是本申请卷积神经网络模型轻量化方法一实施例的流程示意图;
[0017]图7是图6中编码的流程示意图;
[0018]图8是图6中解码的流程及初始轻量化模型的示意图;
[0019]图9是图6中粒子群迭代的流程示意图;
[0020]图10是本申请图像识别方法一实施例的流程示意图;
[0021]图11是本申请电子设备一实施例的结构示意图;
[0022]图12是本申请计算机存储介质一实施例的结构示意图。
具体实施方式
[0023]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本申请保护的范围。
[0024]本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可
选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0025]本申请提出的卷积神经网络模型轻量化方法及卷积神经网络模型轻量化可以用于图像识别、目标检测、目标跟踪、语义分割、自然语言处理等领域。下文中,本申请以图像识别领域进行介绍。
[0026]本申请首先提出一种卷积神经网络模型轻量化方法,如图1所示,图1是本申请卷积神经网络模型轻量化方法一实施例的流程示意图。本实施例卷积神经网络模型轻量化方法具体包括以下步骤:
[0027]步骤S11:获取原始卷积神经网络模型,并采用图像数据集对原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数。
[0028]其中,原始卷积神经网络模型为待优化的卷积神经网络模型,其可以为任意规模或任意结构;利用当前图像识别任务的所采集的图像数据集对原始卷积神经网络模型进行训练,直到原始卷积神经网络模型收敛,保存原始卷积神经网络模型的模型参数,并得到对应的预训练卷积神经网络模型。
[0029]步骤S12:对预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络模型轻量化方法,其特征在于,包括:获取原始卷积神经网络模型,并采用图像数据集对所述原始卷积神经网络模型进行训练,获得预训练卷积神经网络模型及其模型参数;对所述预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型;基于所述模型参数对所述初始轻量化模型进行调整,获取卷积神经网络轻量化模型,以基于所述卷积神经网络轻量化模型对图像进行处理。2.根据权利要求1所述的卷积神经网络模型轻量化方法,其特征在于,所述对所述预训练卷积神经网络模型的特征通道进行轻量化处理,得到初始轻量化模型包括:获取所述预训练卷积神经网络的特征通道的最优保留状态;基于所述最优保留状态删除所述预训练卷积神经网络模型中的冗余特征通道,得到所述初始轻量化模型。3.根据权利要求1所述的卷积神经网络模型轻量化方法,其特征在于,所述获取所述预训练卷积神经网络的特征通道的最优保留状态包括:对所述预训练卷积神经网络模型的特征通道进行编码,且生成多个编码序列,其中,所述编码序列包括每个所述特征通道的保留状态;采用粒子群算法对所述多个编码序列进行迭代,获得全局最优编码序列,其中,所述编码序列与所述粒子群中的粒子一一对应;获取所述全局最优编码序列对应的所述保留状态为所述特征通道的最优保留状态。4.根据权利要求3所述的卷积神经网络模型轻量化方法,其特征在于,所述采用粒子群算法对所述多个编码序列进行迭代,获得全局最优编码序列包括:将所述多个编码序列作为所述粒子群初始的位置向量;将每个所述编码序列解码为对应的轻量化模型;利用数据集对所述轻量化模型进行训练,并获得所述轻量化模型的损失值;基于所述损失值对所述粒子群初始的位置向量进行迭代,获取所述损失值的最小值对应的所述编码序列为所述全局最优编码序列。5.根据权利要求4所述的卷积神经网络模型轻量化方法,其特征在于,所述基于所述损失值对所述粒子群初始的位置向量进行迭代,获取所述损失值的最小值对应的所述编码序列为所述全局最优编码序列包括:在每次所述迭代过程中,获取所述损失值的最小值对应的所述位置向量为当前最优位置向量;响应于所述当前最优位置向量对应的所述损失值小于全局最优位置向量对应的所述损失值,则将所述全局最优位置向量更新为所述当前最优位置向量;获取与所述全局最优位置向量对应的所述编码序...

【专利技术属性】
技术研发人员:徐瑾孙志亮罗亮黄鹏
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1