The present invention belongs to the field of image processing technology. Based on Full Convolution Case Semantic Segmentation (FCIS) algorithm, an enhanced Full Convolution Case Semantic Segmentation algorithm for small target detection is disclosed, which includes shared feature map extraction, preselected frame extraction, position sensitive fractional map generation, classification and regression. In the process of extracting shared feature map, a fusion of conv1, conv3 and conv5 is proposed. The shared feature graph retains high semantic information and high detail information. In the process of pre-selection box extraction, dual RPN algorithm is proposed to overcome the poor effect of pre-selection box extraction network. Its average recall rate is 7% higher than that of RPN. The mAP of the EFCIS algorithm of the invention is 3.5% higher than that of the FCIS, and for small size targets, the mAP of the EFCIS algorithm is 2.9% higher than that of the FCIS. Experiments show that the present invention is very helpful to enhance the ability of grasping small targets.
【技术实现步骤摘要】
一种适用于小目标检测的增强的全卷积实例语义分割算法
本专利技术属于图像处理
,尤其涉及一种适用于小目标检测的增强的全卷积实例语义分割算法。
技术介绍
目前,业内常用的现有技术是这样的:场景理解是计算机视觉领域的一个核心难点,而实例语义分割是实现场景理解的一个必要过程,在图像领域,实例语义分割是集合图像分类,目标检测,图像分割的综合性任务,它被广泛应用于地理信息系统,无人驾驶,医疗图像分析,机器人及其他领域。随着基于卷积神经网络的深度学习迅速发展,越来越多的实例语义分割子任务可以使用卷积神经网络来完成,并且近年来,全卷积神经网络(FCN)相关算法已经垄断了图像语义分割领域,其中,使用全卷积神经网络处理图像语义分割相关算法中,全卷积实例语义分割(FCIS)取得了极其优异的效果,全卷积实例语义分割(FCIS)集合了现阶段众多优秀的成果,是第一个实现端到端的卷积实例语义分割的算法,并且在实例语义分割领域的成果遥遥领先其他算法,它获得了2016MSCOCOsegmentationchallenge第一名,并且远远领先第二名。综上所述,现有技术存在的问题是:(1)由于卷积神经网络自身的缺陷—卷积神经网络的降采样,导致图片中较小的目标可能在共享特征提取的过程中就消失,无法参与算法的后期任务。(2)全卷积实例语义分割(FCIS)是典型的“two-stage”算法,在该算法的第一阶段需要提取大量预选框,而现有RPN网络对于预选框提取的召回率还存在一些不足,导致在该算法的后期任务的性能降低。解决上述技术问题的难度和意义:难度:(1)、针对卷积神经网络降采样导致小目标特征 ...
【技术保护点】
1.一种适用于小目标检测的增强的全卷积实例语义分割算法,其特征在于,所述适用于小目标检测的增强的全卷积实例语义分割算法包括:步骤一:共享特征图提取,对不同层的特征图的分辨率进行上采样或下采样并进行特征融合;步骤二:预选框提取,conv3和conv4分别训练两个RPN网络,对两个RPN网络产生的预选框采用非极大值抑制NMS进行综合提取;步骤三:产生基于位置敏感的分数图谱,基于全卷积网络FCN产生共享特征图,再使用2k2×(C+1)‑d维1×1卷积产生位置敏感的分数图谱,其中C+1表示C个目标类别和1个背景类别,每个ROI的位置敏感特征图谱由相应的k2个位置敏感图谱拼接而成;步骤四:分类和回归,对于步骤三产生的ROI位置敏感图谱进行回归、对应的分数图谱进行分类,分类中,通过拼接对应的ROI位置敏感图谱得到像素级的分数图谱,将ROI内的每个像素,通过两个1×1的卷积分别判断该像素是否在本ROI内和该像素是否在目标物体的边界范围内。
【技术特征摘要】
1.一种适用于小目标检测的增强的全卷积实例语义分割算法,其特征在于,所述适用于小目标检测的增强的全卷积实例语义分割算法包括:步骤一:共享特征图提取,对不同层的特征图的分辨率进行上采样或下采样并进行特征融合;步骤二:预选框提取,conv3和conv4分别训练两个RPN网络,对两个RPN网络产生的预选框采用非极大值抑制NMS进行综合提取;步骤三:产生基于位置敏感的分数图谱,基于全卷积网络FCN产生共享特征图,再使用2k2×(C+1)-d维1×1卷积产生位置敏感的分数图谱,其中C+1表示C个目标类别和1个背景类别,每个ROI的位置敏感特征图谱由相应的k2个位置敏感图谱拼接而成;步骤四:分类和回归,对于步骤三产生的ROI位置敏感图谱进行回归、对应的分数图谱进行分类,分类中,通过拼接对应的ROI位置敏感图谱得到像素级的分数图谱,将ROI内的每个像素,通过两个1×1的卷积分别判断该像素是否在本ROI内和该像素是否在目标物体的边界范围内。2.如权利要求1所述的适用于小目标检测的增强的全卷积实例语义分割算法,其特征在于,步骤一,具体包括:共享特征图提取,在输入图片宽高比不变时,将短边调整为600;采用ResNet-101基础网络模型融合conv1,conv3和conv5层的特征图来提取共享特征图;对不同层的特征图采用不同的上采样或下采样使得特征图的分辨率一致;对于conv1采用dilation为2,stride为2,kernel为3,padding为0的膨胀卷积,使conv1层的特征图的分辨率下降2倍;保持conv3分辨率不变;融合conv3和降采样后的conv1的特征图,再使用1×1×512的卷积将来自conv1和conv3的特征图压缩在统一空间内;conv5层采用dilation为2,stride为2,kernel为3,padding为0的反卷积(Deconv),使得conv5层的特征图分辨率上采样2倍;使用1×1×512卷积融合来自conv1,conv3,conv5层的特征图,最终实现特征融合。3.如权利要求1所述的适用于小目标检测的增强的全卷积实例语义分割算法,其特征在于,步骤二具体包括:1)通过conv4层特征训练深层RPN网络;2)在conv3的基础上添加由3个3×3×512卷积层组成的语义增强网络;3)在步骤2)输出的特征图的基础上,训练浅层RPN网络;4)步骤1)和步骤3)的RPN网络各自产生300个预选框,采用soft-NMS算法融合2个RPN网络的预选框,并且设置soft-NMS算法的参数IoU为0.7,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。