细粒度小目标快速识别的方法和装置制造方法及图纸

技术编号:27477281 阅读:13 留言:0更新日期:2021-03-02 17:46
本申请公开了一种细粒度小目标快速识别的方法和装置,涉及目标识别领域。该方法包括:在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型,将待识别的图像输入到检测模型中进行处理,采用带有注意力机制的卷积操作抽取图像的浅层特征,得到多通道的浅层特征图,采用带有注意力机制的残差操作抽取图像的语义特征,得到多通道的语义特征图,并对浅层特征图和语义特征图进行融合,将融合后的特征图输入到检测器,根据目标类别检测出小目标。该装置包括:建立模块、输入模块、卷积模块、残差模块和检测模块。本申请提高了模型的泛化能力和目标检测的速度,有效提高了小目标的检测能力和识别精度。的检测能力和识别精度。的检测能力和识别精度。

【技术实现步骤摘要】
细粒度小目标快速识别的方法和装置


[0001]本申请涉及目标识别领域,特别是涉及一种细粒度小目标快速识别的方法和装置。

技术介绍

[0002]随着计算机技术的发展,目标识别的应用已经越来越广泛。现有的目标识别算法普遍通过采用不同尺度来识别大目标和小目标。尽管这种方法在一定程度上提高了对小目标的检测能力,但是检测小目标效果的提升并不明显。由于小目标本身的特点是尺寸通常很小,不同的两个小目标之间的区别更加小,而这种方法忽略了小目标的本质特征,没有区分像素之间的相关性,会直接导致针对小目标提取出来的特征泛化能力较差。而且,随着网络不断变深,池化操作在提高感受野的同时,会减小图像分辨率,导致小目标的边缘信息减弱,甚至随着池化层逐渐消失,进而导致小目标识别漏检率偏高,降低识别的准确率和召回率,识别速度也受影响。

技术实现思路

[0003]本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0004]根据本申请的一个方面,提供了一种细粒度小目标快速识别的方法,包括:
[0005]在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型;
[0006]将待识别的图像输入到所述检测模型中进行处理;
[0007]采用带有注意力机制的卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图;
[0008]采用带有注意力机制的残差操作抽取所述图像的语义特征,得到多通道的语义特征图,并对所述浅层特征图和语义特征图进行融合;
[0009]将融合后的特征图输入到检测器,根据目标类别检测出小目标。
[0010]可选地,采用带有注意力机制的卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图,包括:
[0011]采用卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图,将所述浅层特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果作为所述卷积操作的结果输出。
[0012]可选地,采用带有注意力机制的残差操作抽取所述图像的语义特征,得到多通道的语义特征图,并对所述浅层特征图和语义特征图进行融合,包括:
[0013]采用残差操作对所述卷积操作的结果抽取语义特征,得到多通道的语义特征图,将所述语义特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果与所述语义特征图进行融合。
[0014]可选地,执行空间注意力操作,包括:
[0015]将输入的特征图传输至空间注意力模块,所述空间注意力模块根据所述特征图中
有效信息的分布生成相应的空间注意力权值矩阵,然后将所述输入的特征图与所述空间注意力权值矩阵进行相乘。
[0016]可选地,对所述空间注意力操作的结果执行通道注意力操作,包括:
[0017]将所述空间注意力操作的结果传输至通道注意力模块,所述通道注意力模块根据多通道特征图的重要程度生成相应的通道注意力权值矩阵,然后将所述空间注意力操作的结果与所述通道注意力权值矩阵进行相乘。
[0018]可选地,在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型,包括:
[0019]对YOLOv3算法模型进行降尺度处理,删除用于识别大目标的尺度,保留其余两个尺度,然后增加注意力机制,得到检测模型。
[0020]可选地,将融合后的特征图输入到检测器,根据目标类别检测出小目标,包括:
[0021]将融合后的特征图分别传输至两个分支,一个分支经带有注意力机制的卷积操作后传输至第一检测器,根据目标类别检测出小目标,另一个分支经上采样操作后与上层特征图进行融合,并经带有注意力机制的卷积操作后传输至第二检测器,根据目标类别检测出微小目标。
[0022]根据本申请的另一个方面,提供了一种细粒度小目标快速识别的装置,包括:
[0023]建立模块,其配置成在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型;
[0024]输入模块,其配置成将待识别的图像输入到所述检测模型中进行处理;
[0025]卷积模块,其配置成采用带有注意力机制的卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图;
[0026]残差模块,其配置成采用带有注意力机制的残差操作抽取所述图像的语义特征,得到多通道的语义特征图,并对所述浅层特征图和语义特征图进行融合;
[0027]检测模块,其配置成将融合后的特征图输入到检测器,根据目标类别检测出小目标。
[0028]可选地,所述卷积模块具体配置成:
[0029]采用卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图,将所述浅层特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果作为所述卷积操作的结果输出。
[0030]可选地,所述残差模块具体配置成:
[0031]采用残差操作对所述卷积操作的结果抽取语义特征,得到多通道的语义特征图,将所述语义特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果与所述语义特征图进行融合。
[0032]可选地,所述卷积模块或残差模块还包括:
[0033]空间注意力模块,其配置成接收输入的特征图,根据所述特征图中有效信息的分布生成相应的空间注意力权值矩阵,然后将所述输入的特征图与所述空间注意力权值矩阵进行相乘。
[0034]可选地,所述卷积模块或残差模块还包括:
[0035]通道注意力模块,其配置成接收输入的所述空间注意力操作的结果,根据多通道
特征图的重要程度生成相应的通道注意力权值矩阵,然后将所述空间注意力操作的结果与所述通道注意力权值矩阵进行相乘。
[0036]可选地,所述建立模块具体配置成:
[0037]对YOLOv3算法模型进行降尺度处理,删除用于识别大目标的尺度,保留其余两个尺度,然后增加注意力机制,得到检测模型。
[0038]可选地,所述检测模块具体配置成:
[0039]将融合后的特征图分别传输至两个分支,一个分支经带有注意力机制的卷积操作后传输至第一检测器,根据目标类别检测出小目标,另一个分支经上采样操作后与上层特征图进行融合,并经带有注意力机制的卷积操作后传输至第二检测器,根据目标类别检测出微小目标。
[0040]根据本申请的又一个方面,提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法。
[0041]根据本申请的又一个方面,提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如上所述的方法。
[0042]根据本申请的又一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细粒度小目标快速识别的方法,其特征在于,包括:在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型;将待识别的图像输入到所述检测模型中进行处理;采用带有注意力机制的卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图;采用带有注意力机制的残差操作抽取所述图像的语义特征,得到多通道的语义特征图,并对所述浅层特征图和语义特征图进行融合;将融合后的特征图输入到检测器,根据目标类别检测出小目标。2.根据权利要求1所述的方法,其特征在于,采用带有注意力机制的卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图,包括:采用卷积操作抽取所述图像的浅层特征,得到多通道的浅层特征图,将所述浅层特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果作为所述卷积操作的结果输出。3.根据权利要求2所述的方法,其特征在于,采用带有注意力机制的残差操作抽取所述图像的语义特征,得到多通道的语义特征图,并对所述浅层特征图和语义特征图进行融合,包括:采用残差操作对所述卷积操作的结果抽取语义特征,得到多通道的语义特征图,将所述语义特征图作为输入执行空间注意力操作,对所述空间注意力操作的结果执行通道注意力操作,将所述通道注意力操作的结果与所述语义特征图进行融合。4.根据权利要求2或3所述的方法,其特征在于,执行空间注意力操作,包括:将输入的特征图传输至空间注意力模块,所述空间注意力模块根据所述特征图中有效信息的分布生成相应的空间注意力权值矩阵,然后将所述输入的特征图与所述空间注意力权值矩阵进行相乘。5.根据权利要求2或3所述的方法,其特征在于,对所述空间注意力操作的结果执行通道注意力操作,包括:将所述空间注意力操作的结果传输至通道注意力模块,所述通道注意力模块根据多通道特征图的重要程度生成相应的通道注意力权值矩阵,然后将所述空间注意力操作的结果与所述通道注意力权值矩阵进行相乘。6.根据权利要求1所述的方法,其特征在于,在基于深度神经网络的目标识别算法中增加注意力机制,得到检测模型,包括:对YOLOv3算法模型进行降尺度处理,删除用于识别大目标的尺度,保留其余两个尺度,然后增加注意力机制,得到检测模型。7.根据权利要求6所述的方法,其特征在于,将融合后的特征图输入到检测器,根据目标类别检测出小目标,包括:将融合后的特征图分别传输至两个分支,一个分支经带有注意力机制的卷积操作后传输至第一检测器,根据目标类别检测出小目标,另一个分支经上采样操作后与上层特征图进行融合,并经...

【专利技术属性】
技术研发人员:湛强黄成
申请(专利权)人:苏州小阳软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1