一种实时目标检测的方法、系统及装置制造方法及图纸

技术编号:21200920 阅读:39 留言:0更新日期:2019-05-25 01:32
本发明专利技术公开一种实时目标检测的方法、系统及装置,其中方法步骤为:获取待检测的图片,对图片进行第一卷积处理获得第一特征图;结合第一特征图、第一空间信息和第一通道信息获得第二特征图;对第二特征图进行第二卷积处理获得第三特征图;结合第三特征图、第二空间信息和第二通道信息获得第四特征图;对第四特征图进行第三卷积处理获得第五特征图;依次对第五特征图进行多次反卷积处理后,获得第六特征图、第七特征图和第八特征图,以及通过结合特征图获取第九特征图和第十特征图,对第六特征图、第九特征图和第十特征图进行分类和边界框的预测,本发明专利技术通过结合不同特征图以及空间信息和通道信息来提高检测准确率,可广泛应用于目标检测领域。

A Real-time Target Detection Method, System and Device

The invention discloses a method, system and device for real-time target detection, in which the method steps are: acquiring pictures to be detected, first convolution processing of pictures to obtain the first feature map; combining the first feature map, the first spatial information and the first channel information to obtain the second feature map; second convolution processing of the second feature map to obtain the third feature map; and combining the third feature map; Fifth feature map is obtained by the third convolution of the fourth feature map, the sixth feature map, the seventh feature map and the eighth feature map are obtained by deconvolution of the fifth feature map, and the ninth feature map and the tenth feature map are obtained by combining the eigenvalue map with the eigenvalue map. The method improves the detection accuracy by combining different feature maps, spatial information and channel information, and can be widely used in the field of target detection.

【技术实现步骤摘要】
一种实时目标检测的方法、系统及装置
本专利技术涉及目标检测领域,尤其涉及一种实时目标检测的方法、系统及装置。
技术介绍
随着深度学习的不断发展,在自然语言处理以及目标检测和分类方面也取得了不错的进步。其中目标检测主要分为两分支,一分支是具有两阶段的目标检测,如:RCNN系列(RCNN、FastRCNN以及RFCN等)这些目标检测方法分为两个阶段,在第一阶段,通过算法或区域提议网络生成高质量的候选框。然后在第二阶段设计子网络对这些候选框进行分类和边框回归,因此由于这类检测方法分为两阶段所以在检测速度方面存在缺陷,达不到实时的效果。另一分支则是单阶段的目标检测方法(如YOLO、SSD以及DSOD等),因为没有产生候选框阶段所以相对于前一种方法来说准确率相对较差,但其检测速度十分优秀可以达到实时的检测。目前基于单阶段的目标检测方法的改进主要是通过结合不同特征图的信息或者采用更复杂的网络结构来获取具有高语义的特征信息,例如:在YOLO方法中直接在最后的卷积层上进行边界框回归的目标检测,SSD方法则是在YOLO方法的基础上提出来的,该方法是结合最后几个卷积层进行预测,因而有更高的准确率。DSSD方法则是在SSD的改进,通过采用更复杂的网络结构(ResNet)进行特征提取,并结合反卷积层获取更多的语义信息。在Single-ShotBidirectionalPyramidNetworks的方法中则采用了双向的特征金字塔网络结构,结合了底层和高层之间的特征信息,并采用了一个级联的锚优化模块来提高候选框的定位能力。上述大多数的改进方法都是在牺牲检测速度的基础上提高其检测精度,例如:1、采用更复杂的网络模型进行特征提取的方法。在DSSD方法中,因其用于特征提取的网络结构ResNet相对复杂,引入了较多的参数所以在检测帧率上会大幅度下降;2、通过引入新的模块来解决单阶段目标检测的正负样本失衡问题。在Single-ShotBidirectionalPyramidNetworks方法中便通过添加一个新的级联的锚优化模块来提高方法的定位准确率,同样在Single-shotRefinementNeuralNetwork方法中也引入了类似的锚优化模块来去除一些负样本。相比于通过引入新的损失函数来缓解正负样本严重失衡问题,添加新模块的这种方法也增加了训练参数,从而也会使检测速率极大地下降。名词解释:CoupleNet:复合网络。CBAM:(ConvolutionalBlockAttentionModule)卷积块注意模块。DSOD:(DeeplySupervisedObjectDetectors)强监督目标检测器。DSSD(DeconvolutionalSingleShotDetector)反卷积的单次多边界盒检测器。FocalLoss:聚焦损失。FPN:(FeaturePyramidNetworks)空间金字塔网络。FastRCNN:基于区域提议的快速卷积神经网络。IOU:(IntersectionoverUnion)重叠度。NMS:(Non-MaximumSuppression)非极大值抑制。RCNN:(RegionswithCNNfeatures)基于区域提议的卷积神经网络。RFCN:(Region-basedFullyConvolutionalNetworks)基于区域提议的全卷积网络。ROIPooling:(RegionofInterestPooling)感兴趣区域池化。ResNet:深度残差网络。Soft-NMS:(SoftNon-MaximumSuppression)软化非极大值抑制。SSD:(SingleShotMultiBoxDetector)单次多边界盒检测器。SENet:(Squeeze-and-ExcitationNetworks)压缩激励网络。Single-ShotBidirectionalPyramidNetworks:单次双向的金字塔网络。Single-shotRefinementNeuralNetwork:单次优化神经网络。VGG:即VisualGeometryGroup的缩写。YOLO:即Youonlylookonce的缩写。
技术实现思路
为了解决上述技术问题,本专利技术的目的是提供一种高准确率的实时目标检测的方法、系统及装置。本专利技术方法所采用的技术方案是:一种实时目标检测的方法,包括以下步骤:获取待检测的图片,并对图片进行第一卷积处理后,获得第一特征图;提取第一特征图的第一空间信息和第一通道信息后,结合第一特征图、第一空间信息和第一通道信息获得第二特征图;对第二特征图进行第二卷积处理后,获得第三特征图;提取第三特征图的第二空间信息和第二通道信息后,结合第三特征图、第二空间信息和第二通道信息获得第四特征图;对第四特征图进行第三卷积处理后,获得第五特征图;对第五特征图进行第一反卷积处理后,获得第六特征图;对第六特征图进行第二反卷积处理后,获得第七特征图;对第七特征图进行第三反卷积处理后,获得第八特征图;将第一特征图与第八特征图进行合并后获得第九特征图,以及将第三特征图与第七特征图进行合并后获得第十特征图;根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。进一步,所述预设的损失函数包括分类损失函数、边界框回归损失函数和聚焦损失函数。进一步,所述根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测这一步骤,具体为:结合分类损失函数、边界框回归损失函数、聚焦损失函数和预设的IOU阈值分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。进一步,所述提取第一特征图的第一空间信息和第一通道信息这一步骤,具体为:采用预设的卷积块注意模块提取第一特征图的第一空间信息和第一通道信息。进一步,所述卷积块注意模块包括通道注意模块和空间注意模块。进一步,所述对图片进行第一卷积处理这一步骤,具体为:采用预设的卷积层对图片进行第一卷积处理,并提取图片中的特征信息,所述特征信息包括位置信息和语义信息。进一步,所述卷积层采用VGG-16网络模型。本专利技术系统所采用的技术方案是:一种实时目标检测的系统,包括:第一卷积模块,用于获取待检测的图片,并对图片进行第一卷积处理后,获得第一特征图;第一提取模块,用于提取第一特征图的第一空间信息和第一通道信息后,结合第一特征图、第一空间信息和第一通道信息获得第二特征图;第二卷积模块,用于对第二特征图进行第二卷积处理后,获得第三特征图;第二提取模块,用于提取第三特征图的第二空间信息和第二通道信息后,结合第三特征图、第二空间信息和第二通道信息获得第四特征图;第三卷积模块,用于对第四特征图进行第三卷积处理后,获得第五特征图;第四卷积模块,用于对第五特征图进行第一反卷积处理后,获得第六特征图;第五卷积模块,用于对第六特征图进行第二反卷积处理后,获得第七特征图;第六卷积模块,用于对第七特征图进行第三反卷积处理后,获得第八特征图;合并模块,用于将第一特征图与第八特征图进行合并后获得第九特征图,以及将第三特征图与第七特征图进行合并后获得第十特征图;预测模块,用于根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测本文档来自技高网
...

【技术保护点】
1.一种实时目标检测的方法,其特征在于,包括以下步骤:获取待检测的图片,并对图片进行第一卷积处理后,获得第一特征图;提取第一特征图的第一空间信息和第一通道信息后,结合第一特征图、第一空间信息和第一通道信息获得第二特征图;对第二特征图进行第二卷积处理后,获得第三特征图;提取第三特征图的第二空间信息和第二通道信息后,结合第三特征图、第二空间信息和第二通道信息获得第四特征图;对第四特征图进行第三卷积处理后,获得第五特征图;对第五特征图进行第一反卷积处理后,获得第六特征图;对第六特征图进行第二反卷积处理后,获得第七特征图;对第七特征图进行第三反卷积处理后,获得第八特征图;将第一特征图与第八特征图进行合并后获得第九特征图,以及将第三特征图与第七特征图进行合并后获得第十特征图;根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。

【技术特征摘要】
1.一种实时目标检测的方法,其特征在于,包括以下步骤:获取待检测的图片,并对图片进行第一卷积处理后,获得第一特征图;提取第一特征图的第一空间信息和第一通道信息后,结合第一特征图、第一空间信息和第一通道信息获得第二特征图;对第二特征图进行第二卷积处理后,获得第三特征图;提取第三特征图的第二空间信息和第二通道信息后,结合第三特征图、第二空间信息和第二通道信息获得第四特征图;对第四特征图进行第三卷积处理后,获得第五特征图;对第五特征图进行第一反卷积处理后,获得第六特征图;对第六特征图进行第二反卷积处理后,获得第七特征图;对第七特征图进行第三反卷积处理后,获得第八特征图;将第一特征图与第八特征图进行合并后获得第九特征图,以及将第三特征图与第七特征图进行合并后获得第十特征图;根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。2.根据权利要求1所述的一种实时目标检测的方法,其特征在于,所述预设的损失函数包括分类损失函数、边界框回归损失函数和聚焦损失函数。3.根据权利要求2所述的一种实时目标检测的方法,其特征在于,所述根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测这一步骤,具体为:结合分类损失函数、边界框回归损失函数、聚焦损失函数和预设的IOU阈值分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。4.根据权利要求1所述的一种实时目标检测的方法,其特征在于,所述提取第一特征图的第一空间信息和第一通道信息这一步骤,具体为:采用预设的卷积块注意模块提取第一特征图的第一空间信息和第一通道信息。5.根据权利要求4所述的一种实时目标检测的方法,其特征在于,所述卷积块注意模块包括通道注意模块和空间注意模块。6.根据权利要求5所述的一种实时目标检测的方法,其特征在于,所述对图片进行第一卷积处理这一步骤,具体为:采用预设的卷积层...

【专利技术属性】
技术研发人员:葛海玉杨琳郝禄国龙鑫曾文彬李伟儒
申请(专利权)人:广州海昇计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1