一种基于可变形部分的完全卷积网络进行目标检测的方法技术

技术编号:17486529 阅读:84 留言:0更新日期:2018-03-17 10:45
本发明专利技术提出了一种基于可变形部分的完全卷积网络进行目标检测的方法,主要要包括完全卷积特征提取、基于可变形部分RoI池和可变形部分的分类和定位预测,以完全卷积网络(FCN)作为骨干网络结构,采用可变形部分RoI池,将区域建议R分成几部分,定位这些局部对象的最佳匹配形状,并在图像中的相应位置对齐,预测采用两分支对区域建议进行分类和定位来进行。本发明专利技术利用完全卷积网络,在整个图像的计算中共享,提供与任务相关的特征映射,采用特殊的RoI集合推断区域位置,最终预测进行简单的汇总,获得分类和定位进行目标检测。保证了分类和检测任务之间的匹配度,同事保证了特征图的分别率,提高目标检测的准确率。

A method of target detection based on complete convolution network based on deformable part

The invention provides a method for target detection based on deformation complete convolution network part, mainly including extraction, complete convolution characteristics of RoI deformable part pool and predictable part of the classification and localization of deformation based on the complete convolutional network (FCN) as the complex structure of the backbone network, using deformable RoI pool. The R area is divided into several parts, the best matching shape to locate these local objects, and the corresponding alignment in the image, the branch prediction on the regional classification and location of suggestions. The invention uses the complete convolution network to share in the whole image computation, and provides task related feature mapping. It uses special RoI sets to deduce the location of the region, and finally predicts the simple summary, and gets the classification and location for target detection. The matching degree between the classification and the detection tasks is guaranteed. The colleagues guarantee the rate of the feature map and improve the accuracy of the target detection.

【技术实现步骤摘要】
一种基于可变形部分的完全卷积网络进行目标检测的方法
本专利技术涉及目标检测领域,尤其涉及一种基于可变形部分的完全卷积网络进行目标检测的方法。
技术介绍
近几年,基于深度卷积网络的深度学习在一些视觉领域获得广泛的应用,主要用于图像分割、语义分割以及目标检测等领域。目标检测成为人工智能领域的关键技术之一,并且在视觉导航、智能交通、视频检索及压缩、三维重构、安全监控和医疗等方面有广阔应用,此外,在交通流量控制、车辆异常行为监测等民用大场景领域都有广泛应用。现阶段常用的区域建议网络将重点放在图像中的感兴趣的区域,对该区域进行分类和定位,该方法仍有很多不足,容易产生分类和检测任务之间的不匹配,并且降低了特征图的空间分辨率,使网络对区域内的对象位置不敏感,影响准确率,因此,现有的目标检测方法仍存在一定的局限性。本专利技术提出了一种基于可变形部分的完全卷积网络进行目标检测的方法,以完全卷积网络(FCN)作为骨干网络结构,采用可变形部分RoI池,将区域建议R分成几部分,定位这些局部对象的最佳匹配形状,并在图像中的相应位置对齐,预测采用两分支对区域建议进行分类和定位来进行。本专利技术利用完全卷积网络,本文档来自技高网...
一种基于可变形部分的完全卷积网络进行目标检测的方法

【技术保护点】
一种基于可变形部分的完全卷积网络进行目标检测的方法,其特征在于,主要包括完全卷积特征提取(一);基于可变形部分RoI池(二);可变形部分的分类和定位预测(三)。

【技术特征摘要】
1.一种基于可变形部分的完全卷积网络进行目标检测的方法,其特征在于,主要包括完全卷积特征提取(一);基于可变形部分RoI池(二);可变形部分的分类和定位预测(三)。2.基于权利要求书1所述的可变形部分的完全卷积网络,其特征在于,区域部分表征,通过优化其位置进行对齐,提高分类和定位预测,基于局部的表示对局部变换更具有不变性,部分的结构提供了有关物体几何形状的重要信息。3.基于权利要求书1所述的完全卷积特征提取器(一),其特征在于,以完全卷积网络(FCN)作为骨干网络结构,可以在整个图像的计算中共享,并且减少RoI层,提供与任务相关的特征映射,最终预测进行简单的汇总,在可变形部分的完全卷积网络(DP-FCN)中,采用特殊的RoI集合推断区域位置,完全卷积结构适合于计算所有类中所有部分的响应,作为每一类的映射,相应的结构用于定位,整个图像的完整表示(每一类的每个部分的分类和定位图)通过向前传递获得,并且在同一图像的所有区域之间共享。4.基于权利要求书3所述的响应,在特征图中对部分进行定位,对图的分辨率有较高的要求,FCNs只包含空间层,适合保存空间分辨率,和以网络结束的全连接层网络不同,具体来说,如果步幅太大,部分的变形可能过于粗糙,无法正确地描述物体,通过扩大最后卷积块上的卷积跳过池化,合并最后的三步从而减少步幅。5.基于权利要求书1所述的基于可变形部分RoI池(二),其特征在于,目的是将区域建议R分成几部分,重新定位这些局部对象的最佳匹配形状,每个部分的判别局部元素建模,并在图像中的相应位置对齐,这种基于部分变形更多的是表示不变的转换对象,因为这部分相应定位和位置比较稳定,对于非刚性物体比较有用。6.基于权利要求书5所述的最佳匹配形状,其特征在于,通过一个尺寸为k×k规格网格对部分进行分割,对区域进行匹配,每一个点(i,j)被视为独立的部分Ri,j,因为部分的数量(i.e.k2)作为超参数固定,可以为每一个类c每个区域(i,j)计算获得完整的检测热图zi,j,c,部分只需要在相应的地图中进行优化;部分的变形允许部分在参考位置稍微移动(初始区域的分区),选择最佳的潜在的位移,从选定的位置选择池化值,部分(i,j)的池化分数和分类...

【专利技术属性】
技术研发人员:夏春秋
申请(专利权)人:深圳市唯特视科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1