细粒度小目标快速识别的方法和装置制造方法及图纸

技术编号：27477281 阅读：13 留言：0更新日期：2021-03-02 17:46

本申请公开了一种细粒度小目标快速识别的方法和装置，涉及目标识别领域。该方法包括：在基于深度神经网络的目标识别算法中增加注意力机制，得到检测模型，将待识别的图像输入到检测模型中进行处理，采用带有注意力机制的卷积操作抽取图像的浅层特征，得到多通道的浅层特征图，采用带有注意力机制的残差操作抽取图像的语义特征，得到多通道的语义特征图，并对浅层特征图和语义特征图进行融合，将融合后的特征图输入到检测器，根据目标类别检测出小目标。该装置包括：建立模块、输入模块、卷积模块、残差模块和检测模块。本申请提高了模型的泛化能力和目标检测的速度，有效提高了小目标的检测能力和识别精度。的检测能力和识别精度。的检测能力和识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
细粒度小目标快速识别的方法和装置

[0001]本申请涉及目标识别领域，特别是涉及一种细粒度小目标快速识别的方法和装置。

技术介绍

[0002]随着计算机技术的发展，目标识别的应用已经越来越广泛。现有的目标识别算法普遍通过采用不同尺度来识别大目标和小目标。尽管这种方法在一定程度上提高了对小目标的检测能力，但是检测小目标效果的提升并不明显。由于小目标本身的特点是尺寸通常很小，不同的两个小目标之间的区别更加小，而这种方法忽略了小目标的本质特征，没有区分像素之间的相关性，会直接导致针对小目标提取出来的特征泛化能力较差。而且，随着网络不断变深，池化操作在提高感受野的同时，会减小图像分辨率，导致小目标的边缘信息减弱，甚至随着池化层逐渐消失，进而导致小目标识别漏检率偏高，降低识别的准确率和召回率，识别速度也受影响。

技术实现思路

[0003]本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0004]根据本申请的一个方面，提供了一种细粒度小目标快速识别的方法，包括：
[0005]在基于深度神经网络的目标识别算法中增加注意力机制，得到检测模型；
[0006]将待识别的图像输入到所述检测模型中进行处理；
[0007]采用带有注意力机制的卷积操作抽取所述图像的浅层特征，得到多通道的浅层特征图；
[0008]采用带有注意力机制的残差操作抽取所述图像的语义特征，得到多通道的语义特征图，并对所述浅层特征图和语义特征图进行融合；
[0009]将融合后的特征图输入...

【技术保护点】

【技术特征摘要】
1.一种细粒度小目标快速识别的方法，其特征在于，包括：在基于深度神经网络的目标识别算法中增加注意力机制，得到检测模型；将待识别的图像输入到所述检测模型中进行处理；采用带有注意力机制的卷积操作抽取所述图像的浅层特征，得到多通道的浅层特征图；采用带有注意力机制的残差操作抽取所述图像的语义特征，得到多通道的语义特征图，并对所述浅层特征图和语义特征图进行融合；将融合后的特征图输入到检测器，根据目标类别检测出小目标。2.根据权利要求1所述的方法，其特征在于，采用带有注意力机制的卷积操作抽取所述图像的浅层特征，得到多通道的浅层特征图，包括：采用卷积操作抽取所述图像的浅层特征，得到多通道的浅层特征图，将所述浅层特征图作为输入执行空间注意力操作，对所述空间注意力操作的结果执行通道注意力操作，将所述通道注意力操作的结果作为所述卷积操作的结果输出。3.根据权利要求2所述的方法，其特征在于，采用带有注意力机制的残差操作抽取所述图像的语义特征，得到多通道的语义特征图，并对所述浅层特征图和语义特征图进行融合，包括：采用残差操作对所述卷积操作的结果抽取语义特征，得到多通道的语义特征图，将所述语义特征图作为输入执行空间注意力操作，对所述空间注意力操作的结果执行通道注意力操作，将所述通道注意力操作的结果与所述语义特征图进行融合。4.根据权利要求2或3所述的方法，其特征在于，执行空间注意力操作，包括：将输入的特征图传输至空间注意力模块，所述空间注意力模块根据所述特征图中有效信息的分布生成相应的空间注意力权值矩阵，然后将所述输入的特征图与所述空间注意力权值矩阵进行相乘。5.根据权利要求2或3所述的方法，其特征在于，对所述空间注意力操作的结果执行通道注意力操作，包括：将所述空间注意力操作的结果传输至通道注意力模块，所述通道注意力模块根据多通道特征图的重要程度生成相应的通道注意力权值矩阵，然后将所述空间注意力操作的结果与所述通道注意力权值矩阵进行相乘。6.根据权利要求1所述的方法，其特征在于，在基于深度神经网络的目标识别算法中增加注意力机制，得到检测模型，包括：对YOLOv3算法模型进行降尺度处理，删除用于识别大目标的尺度，保留其余两个尺度，然后增加注意力机制，得到检测模型。7.根据权利要求6所述的方法，其特征在于，将融合后的特征图输入到检测器，根据目标类别检测出小目标，包括：将融合后的特征图分别传输至两个分支，一个分支经带有注意力机制的卷积操作后传输至第一检测器，根据目标类别检测出小目标，另一个分支经上采样操作后与上层特征图进行融合，并经...

【专利技术属性】
技术研发人员：湛强，黄成，
申请(专利权)人：苏州小阳软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人