一种基于改进的MobileNetV3特征提取网络制造技术

技术编号:29092352 阅读:35 留言:0更新日期:2021-06-30 10:00
本发明专利技术公开了一种改进的MobileNetV3的特征提取网络。该模型在基于CNN的计算机视觉技术领域具有一定通用性。以Resnet、Vgg为核心的模型在图像经过特征提取网络处理时忽略了其特征集合存在大量冗余性和相似性,且存在参数量高、计算量大的问题。针对冗余性和相似性的问题,提出shadow

【技术实现步骤摘要】
一种基于改进的MobileNetV3特征提取网络


[0001]本专利技术涉及涉及深度学习中用于提取特征的骨干网络领域。

技术介绍

[0002]计算机视觉领域内目标检测、语义分割等算法模型的构建离不开CNN的支持,现阶段常见的特征提取网络如Resnet通过构建一个体量较为庞大的模型来获取较高的分类精度,然而更深的网络会给网络附加更多的参数量与运算量,以Resnet

101为例该模型参数约为46.5M,浮点运算量则为7.6B,不具备实时性与轻量性。
[0003]随着技术的发展与需求的演变,轻量化模型的越来越受到人们的重视,目前常见的轻量化网络模型大致分为:
[0004](1)MobileNet系列:提出利用逐点卷积(PW)和深度卷积(DW)替代原始卷积核来缩减参数量与计算量,并在后续版本中引入反向残差和h

swish激活函数进一步提升模型表达能力。
[0005](2)ShuffleNet系列:利用分组卷积以及通道混洗等技术对网络模型进行轻量化。
[0006]而纯粹通过高效卷积等方式来缩小模型或压缩特征信息的做法虽然在参数量和运算量对模型有所改善但会无法避免的降低模型精度。因此可以认为,特征图的丰富性及冗余性特点是决定模型是否精准的关键因素,对模型进行轻量化的方式不应该是避免特征的冗余性而是应该利用成本更低、计算更为高效的方式去获取它。本专利技术也将利用运算成本低的方法在保证特征冗余性的同时减少模型运算量。

技术实现思路

[0007]为了克服上述现有技术的不足,本专利技术提出了一种基于改进的MobileNetV3特征提取网络。该技术引用了深度学习中的MobileNetV3网络结构,并针对网络同一层级的输出特征集合具有相似性的特点,对MobileNetV3网络进行了进一步的优化与改进。
[0008]本专利技术所采用的技术方案是:
[0009]步骤1:利用少量卷积核生成本体特征图,卷积方式采用逐点分组卷积,分组卷积的方式可以降低计算量和参数量。
[0010]步骤2:经过逐点分组卷积处理后,由于组间信息无法交流,采用改进的AD

Shuffle通道混洗方式将特征通道进行混洗,即将原始shuffle操作中每组内未参与跨组处理的特征与其他分组内的同类成员进行融合得到全新特征。
[0011]步骤3:该步骤为专利核心内容,原始卷积操作会得到通道数为n的特征图,而步骤1生成的本体特征图的数量m小于n,为了获得原计划数量为n的特征,设计了shadow

module模块,即对步骤1获取到的本体特征采用高效运算手段进行处理,该运算分别在各自通道中进行,得到大量影子特征图,将影子特征图与原始特征图拼接,最终得到数量为n=m
×
s的特征图;
[0012]步骤4:根据前三个步骤提出全新的Shadow

Bottleneck,该模块与Resnet残差块
非常相似,Shadow

Bottleneck主要由两个叠堆的Shadow Module构建而成,第一个Shadow Module主要作用是来增加特征通道数,在输出后需要进行批量化处理和ReLU函数处理,第二个Shadow Module则是用来降低特征通道数用以匹配shortcut的输出,输出只需要进行一次批量化处理,对于stride=2需要在两个Shadow Module间插入一个步长为2的深度卷积进行下采样处理;
[0013]步骤5:参考MobileNetV3的网络结构,将MobileNetV3中的Bottleneck替换成步骤四的Shadow

Bottleneck,最终利用全局平均池化和全连接层将特征图转换为1280维特征向量完成分类。
[0014]与现有技术相比,本专利技术的有益效果是:
[0015](1)对于分类精度,丰富的特征含量使得该模型具有更好的分类准确度;
[0016](2)对于轻量性,分组卷积及shadow module影子特征图高效生成方式使得模型具有更少的计算量。
附图说明
[0017]图1为:原始卷积操作示意图。
[0018]图2为:特征可视化结果图。
[0019]图3为:shadow module模型示意图。
[0020]图4为:逐点分组卷积示意图。
[0021]图5为:Shuffle操作示意图。
[0022]图6为:AD

Shuffle操作示意图。
[0023]图7为:Shadow

Bottleneck模块示意图。
[0024]图8为:EL

MobileNet结构示意图。
[0025]图9为:shadow module输入输出对比图。
[0026]图10为:几类常见模型的运算量与精确度分布散点图。
[0027]图11为:几类常见模型的参数量与精确度分布散点图。
具体实施方式
[0028]下面结合附图对本专利技术进一步说明。
[0029]首先,基于卷积神经网络的网络模型在进行特征提取的过程如图1所示。输入图像X∈H
×
W
×
C
in
,其中H、W和C
in
分别为输入图像的高和宽以及特征通道数,利用n个尺寸为k
×
k的卷积过滤器处理可以得到输出特征图Y∈H
×
W
×
n。随机选取某一层的特征图进行可视化处理,如图2所示,可以发现特征集合里存在许多相似的特征图对。针对上述特性,本专利技术提出了Shadow Module模块,如图3所示,在此模块中,首先利用一些卷积方法生成少量的本体特征图,接着对这些本体特征图采用一些更为廉价的计算方法获取其影子特征图,最终将两者拼接,得到最终的输出结果。
[0030]本体特征图的生成方式我们采用1
×
1分组卷积与改进的通道混洗方法AD

shuffle。逐点分组卷积的过程如图4所示,分组卷积将首先把输入特征图按照特征通道数均分为g组,则每组输入特征图的尺寸为H
×
W
×
C
in
/g,每组对应的卷积核的尺寸则为k
×
k
×
c/g,得到每组输出特征图尺寸为H
×
W
×
n/g。接着将g组输出结果进行拼接,最终得到尺寸
大小为Y

∈H
×
W
×
n的输出特征图,其输出通道数的大小依旧是n。这一过程的计算量见公式(1),从公式中可以发现,其计算量降低为原始计算的1/g。
[0031][0032]分组卷积中由于每组的特征输出仅仅与各个组内的输入特征相关,组与组之间的通信被阻断,图像信息的表征能力会下降,因此需要本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的MobileNetV3特征提取网络,其特征在于,包括以下步骤:步骤1:利用少量卷积核生成本体特征图,卷积方式采用逐点分组卷积,分组卷积的方式可以降低计算量和参数量;步骤2:经过逐点分组卷积处理后,由于组间信息无法交流,采用通道混洗方式将特征通道进行混洗,得到通道重构与交流的全新特征结构;步骤3:该步骤为专利核心内容,原始卷积操作会得到通道数为n的特征图,而步骤1生成的本体特征图的数量m小于n,为了获得原计划数量为n的特征,设计了shadow

module模块,即对步骤1获取到的本体特征采用高效运算手段进行处理,该运算分别在各自通道中进行,得到大量影子特征图,将影子特征图与原始特征图拼接,最终得到数量为n=m
×
s的特征图;步骤4:根据前三个步骤提出全新的Shadow

Bottleneck,该模块与Resnet残差块非常相似,Shadow

B...

【专利技术属性】
技术研发人员:贾宇明唐昊贾海涛田浩琨王子彦王云邹新雷
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1