一种基于faster-RCNN提高小目标检测效果的方法技术

技术编号：26480109 阅读：19 留言：0更新日期：2020-11-25 19:25

本发明专利技术公开了一种基于faster‑RCNN提高小目标检测效果的方法，属于目标检测领域。本发明专利技术包括：获取数据集，并按照相应比例划分成训练集及测试集；构建faster‑RCNN模型；利用训练集对模型进行训练，在训练时，若在第n次迭代中，小目标的loss值达到了预设条件，则在第n+1次迭代中，将多张图片进行缩小，然后拼接成原图大小，再进行训练；在训练结束后，利用测试集对模型进行测试，得到AP值，若小于设定的阈值，则修改相应参数，重新训练，直到模型的小目标AP值达到设定的阈值；利用训练好的模型进行小目标的检测。本发明专利技术能够使小目标的分布更加均匀，进而提高小目标训练的充分度，从而提高小目标的检测精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于faster-RCNN提高小目标检测效果的方法
本专利技术涉及目标检测领域，尤其涉及一种基于faster-RCNN提高小目标检测效果的方法。
技术介绍
目标检测即找出图像中所有感兴趣的物体，包含物体定位和物体分类两个子任务，同时确定物体的类别和位置。目标检测是计算机视觉的一个热门研究方向，广泛应用于自动驾驶、智能工业检测、智能监控等诸多领域，通过利用计算机视觉，自动对图片进行处理，减少了人力劳动，具有很强的现实意义。因此，目标检测算法成为近年来的研究热点。近期，比较流行的目标检测算法有两类，一种是One-Stage的目标检测算法，主要有YOLO算法、SSD算法；另一种是Two-Stage的目标检测算法,如faster-RCNN。然而，目标检测在实际的应用中，往往出现小目标的检测效果远不如大目标和中目标。小目标的AP值要比中目标和大目标的AP值低10％到20％，这说明小目标的检测效果不理想。在COCO数据集中，小目标指的是区域面积小于32*32像素，中目标指的是区域面积大于32*32像素且小于96*96像素,大目标指的是区域面积大于96*96像素。COCO数据集是大型的，与目标检测相关的数据集。在COCO数据集中，经统计发现，在所有的检测框中，有41％的检测框是小目标，然而却只有52％的图片中包含了小目标。与之相比，有73％的图片包含中目标，有83％的图片包含大目标。这也就说明了，小目标的数量很多，但分布远不及中目标和大目标均匀。在实验中，小目标的loss较低，这说明对小目标的训...

【技术保护点】
1.一种基于faster-RCNN提高小目标检测效果的方法，其特征在于，包括如下步骤：/n步骤1、获取数据集，并按照相应比例将数据集划分成训练集及测试集；/n步骤2、构建faster-RCNN模型；/n步骤3、利用所述训练集对构建的faster-RCNN模型进行训练，在对模型进行训练的过程中，如果在第n次迭代中，小目标的loss值如果达到了预设条件，那么在第n+1次迭代中，将多张图片进行缩小，然后拼接成原图大小，再进行训练；/n步骤4、在训练结束后，利用所述测试集对模型进行测试，得到AP值，若得到的AP值小于设定的阈值，则修改相应参数，重新训练，直到模型的小目标AP值达到设定的阈值；/n步骤5、利用训练好的faster-RCNN模型进行小目标的检测。/n

【技术特征摘要】
1.一种基于faster-RCNN提高小目标检测效果的方法，其特征在于，包括如下步骤：
步骤1、获取数据集，并按照相应比例将数据集划分成训练集及测试集；
步骤2、构建faster-RCNN模型；
步骤3、利用所述训练集对构建的faster-RCNN模型进行训练，在对模型进行训练的过程中，如果在第n次迭代中，小目标的loss值如果达到了预设条件，那么在第n+1次迭代中，将多张图片进行缩小，然后拼接成原图大小，再进行训练；
步骤4、在训练结束后，利用所述测试集对模型进行测试，得到AP值，若得到的AP值小于设定的阈值，则修改相应参数，重新训练，直到模型的小目标AP值达到设定的阈值；
步骤5、利用训练好的faster-RCNN模型进行小目标的检测。

2.根据权利要求1所述的一种基于faster-RCNN提高小目标检测效果的方法，其特征在于，步骤1中，所述数据集为COCO数据集，所述COCO数据集是一个已经标注好的大型目标检测数据集。

3.根据权利要求1或2所述的一种基于faster-RCNN提高小目标检测效果的方法，其特征在于，步骤1中，所述训练集与测试集的比例为8：2。

4.根据权利要求1所述的一种基于faster-RCNN提高小目标检测效果的方法，其特征在于，步骤2中，在构建faster-RCNN模型时，依次搭建Conv层、区域生成网络层、感兴趣区域池化层及分类层；
所述Conv层，用于提取图片的特征图；
所述区域生成网络层，用于生成检测框，即初步提取图片中目标候选区域；
所述感兴趣区域池化层，用于获取Conv层生成的特征图和区域生成网络层生成的目标候选区域，并综合信息后提取候选特征图；
所...

【专利技术属性】
技术研发人员：王堃，王铭宇，吴晨，
申请(专利权)人：成都恒创新星科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人