当前位置: 首页 > 专利查询>江南大学专利>正文

融合模块和多尺度特征融合卷积神经网络及图像识别方法技术

技术编号:26599490 阅读:39 留言:0更新日期:2020-12-04 21:22
本发明专利技术涉及一种融合模块和多尺度特征融合卷积神经网络及图像识别方法,包括上一层、融合层以及级联层,所述上一层将输入图片通过所述融合层运算,再将运算完成的结果通过所述级联层进行合并输出,所述融合层由在原始模块中加入瓶颈结构和空洞卷积结构共同组合而成。本发明专利技术不但错误率低,而且有效减少网络的参数量,有利于提升模型泛化能力。

【技术实现步骤摘要】
融合模块和多尺度特征融合卷积神经网络及图像识别方法
本专利技术涉及图像识别的
,尤其是指一种融合模块和多尺度特征融合卷积神经网络及图像识别方法。
技术介绍
深度学习作为机器学习领域的研究热点之一,近年来取得了重大突破。卷积神经网络作为深度学习的代表,应用最为广泛,其典型的应用包括图像识别、场景分割、目标检测等。卷积神经网络已经在不同应用不同任务中取得了显著的效果,但是如此优秀的表现伴随着显著的计算成本,其与该领域的传统算法相比有着更大的运算量及参数量。随着卷积神经网络模型不断逼近计算机视觉任务的精度极限,大部分的深度卷积神经网络的结构也变得愈发复杂,计算卷积层和全连接层需要大量的浮点矩阵运算,计算开销异常昂贵,从在现实中落地的角度,模型过大过深都不利于在对实时性、存储空间、能耗有严格限制的移动设备、嵌入式芯片上使用。为了方便应用,因此需要设计更加轻量级的网络模型。
技术实现思路
为此,本专利技术所要解决的技术问题在于克服现有技术中卷积神经网络卷积核过于单一、不具备多样性以及网络结构复杂、参数冗余的问题,从而提供一种低错误率,有效减少网络的参数量,提升模型泛化能力的融合模块和多尺度特征融合卷积神经网络及图像识别方法。为解决上述技术问题,本专利技术的一种融合模块,包括上一层、融合层以及级联层,所述上一层将输入图片通过所述融合层运算,再将运算完成的结果通过所述级联层进行合并输出,所述融合层由在原始模块中加入瓶颈结构和空洞卷积结构共同组合而成。在本专利技术的一个实施例中,所述融合层中,使用不同尺度的卷积核。在本专利技术的一个实施例中,所述瓶颈结构中设有1×1卷积层和3×3卷积层。在本专利技术的一个实施例中,所述空洞卷积的区域尺寸计算公式为:F(r)=(2r+1-1)×(2r+1-1),其中超参数r表示每个像素之间填充r-1个空格。在本专利技术的一个实施例中,所述融合层具有五个卷积分支通道。在本专利技术的一个实施例中,所述融合模块的参数量F(i,n)的计算方法为:其中k×k为当前卷积核尺寸,Cin为输入通道数,Cout为输出通道数。在本专利技术的一个实施例中,所述融合模块的计算量Flops(i,n)的计算方法为:其中k×k为当前卷积核尺寸,Cin为输入通道数,Cout为输出通道数。本专利技术还公开了一种多尺度特征融合卷积神经网络,包括:输入层、第一卷积层、最大池化层、多个上述任意一项所述的融合模块、分类输出层以及输出层,且每个融合模块的前一层和后一层均使用1×1的卷积操作。在本专利技术的一个实施例中,每个融合模块的前一层和后一层均使用1×1的卷积操作包括:第二卷积层、第一融合模块、第三卷积层、第二融合模块、第四卷积层、第三融合模块、第五卷积层、第四融合模块、第六卷积层、第七卷积层第一融合模块、第二融合模块、第三融合模块、第四融合模块,且所述输入层、第一卷积层、最大池化层、第二卷积层、第一融合模块、第三卷积层、第二融合模块、第四卷积层、第三融合模块、第五卷积层、第四融合模块、第六卷积层、第七卷积层、分类输出层以及输出层按照拓扑结构有序连接。本专利技术还公开了一种多尺度特征融合卷积神经网络的图像识别方法,包括:步骤S1:对多尺度特征融合卷积神经网络的输入图片进行卷积池化操作;步骤S2:对每个融合模块的前一层和后一层均使用1×1的卷积操作;步骤S3:将所述多尺度特征融合卷积神经网络的输出端通过全局平均池化层或者卷积层进行分类输出。本专利技术的上述技术方案相比现有技术具有以下优点:本专利技术所述的融合模块和多尺度特征融合卷积神经网络及图像识别方法,针对传统卷积神经网络参数过多,网络结构复杂的缺点,通过对现有卷积神经网络模型进行分析和比较,设计了多尺度特征融合卷积神经网络MS-FNet,该网络引入融合模块,通过不同大小的卷积核提取不同尺度的特征,既增加了网络的宽度,又提高了鲁棒性,解决了一般卷积神经网络中用于提取特征的卷积核过于单一,不具备多样性和全面性的问题;另外,在网络最后使用卷积层代替传统的全连接层,有效控制了网络模型参数量。实验结果表明,MS-FNet与常见的卷积神经网络模型相比较,网络结构更加合理,收敛速度更快,在参数量远小于其他卷积神经网络模型的情况下,错误率更低,具有更好的泛化能力。附图说明为了使本专利技术的内容更容易被清楚的理解,下面根据本专利技术的具体实施例并结合附图,对本专利技术作进一步详细的说明,其中图1是本专利技术融合模块的示意图;图2是本专利技术原始模块的示意图;图3a和图3b分别是本专利技术标准卷积和瓶颈结构的示意图;图4是本专利技术多尺度特征融合卷积神经网络的示意图;图5是本专利技术MS-FNet在CIFAR-10数据集上的参数设置;图6是本专利技术CIFAR-10实验结果对比;图7是本专利技术CIFAR-100实验结果对比;图8是本专利技术使用空洞卷积和不使用空洞卷积对比结果;图9是本专利技术MNIST数据集实验结果对比;图10是本专利技术MNIST数据集上的准确率曲线对比的示意图;图11是本专利技术CIFAR-10数据集上的交叉熵损失函数曲线对比的示意图。说明书附图标记说明:10-上一层,20-融合层,21-瓶颈结构,22-空洞卷积结构,30-级联层。具体实施方式实施例一如图1所示,本实施例提供一种融合模块(Fusionmodule),包括上一层10、融合层20以及级联层30,所述上一层10将输入图片通过所述融合层20运算,再将运算完成的结果通过所述级联层30进行合并输出,所述融合层20由在原始模块中加入瓶颈结构21和空洞卷积(dilatedconvolution,简称dilatedconv)结构22共同组合而成。本实施例所述融合模块,包括上一层10、融合层20以及级联层30,所述上一层10将输入图片通过所述融合层运算20,再将运算完成的结果通过所述级联层30进行合并输出,所述融合层20由在原始模块中加入瓶颈结构21和空洞卷积结构22共同组合而成,由于所述融合层20可以利用像素大小不一样的特征来代表提取到的不同的细节,然后将这些区域融合就可代表不同细节的融合,相当于是在多个尺度上同时进行卷积,因此提取到的特征也是不同尺度的,这些不同尺度的特征更为丰富,有利于最后分类结果的输出;同时,可以实现不同特征通道之间感受野的不同,使得输出特征不再均匀分布,而是相关性强的特征互相聚集在一起,因此输出的特征冗余的信息较少,解决了一般卷积神经网络中用于提取特征的卷积核过于单一,不具备多样性和全面性的问题,有利于提升网络模型的特征提取能力。所述融合层20中,使用不同尺度的卷积核,就可以实现不同特征通道之间感受野的不同,使得输出特征不再均匀分布,而是相关性强的特征互相聚集在一起,因此输出的特征冗余的信息较少,从而到达提升网络模型的特征提取能力的目的。具体地,如图2所示,所述原始模块的结构特点如下:首先,利用卷积分解,由于使用不同尺度的卷积核,因此可以将同一本文档来自技高网...

【技术保护点】
1.一种融合模块,其特征在于:包括上一层、融合层以及级联层,所述上一层将输入图片通过所述融合层运算,再将运算完成的结果通过所述级联层进行合并输出,所述融合层由在原始模块中加入瓶颈结构和空洞卷积结构共同组合而成。/n

【技术特征摘要】
1.一种融合模块,其特征在于:包括上一层、融合层以及级联层,所述上一层将输入图片通过所述融合层运算,再将运算完成的结果通过所述级联层进行合并输出,所述融合层由在原始模块中加入瓶颈结构和空洞卷积结构共同组合而成。


2.根据权利要求1所述的融合模块,其特征在于:所述融合层中,使用不同尺度的卷积核。


3.根据权利要求1所述的融合模块,其特征在于:所述瓶颈结构中设有1×1卷积层和3×3卷积层。


4.根据权利要求1所述的融合模块,其特征在于:所述空洞卷积的区域尺寸计算公式为:F(r)=(2r+1-1)×(2r+1-1),其中超参数r表示每个像素之间填充r-1个空格。


5.根据权利要求1所述的融合模块,其特征在于:所述融合层具有五个卷积分支通道。


6.根据权利要求1所述的融合模块,其特征在于:所述融合模块的参数量F(i,n)的计算方法为:其中k×k为当前卷积核尺寸,Cin为输入通道数,Cout为输出通道数。


7.根据权利要求1所述的融合模块,其特征在于:所述融合模块的计算量Flops(i,n)的计算方法为:其中k×k为当前卷积核尺寸,Cin为输入通道数,Cout为输出通道...

【专利技术属性】
技术研发人员:钱雪忠陈鑫华
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1