一种基于faster-RCNN提高小目标检测效果的方法技术

技术编号:26480109 阅读:19 留言:0更新日期:2020-11-25 19:25
本发明专利技术公开了一种基于faster‑RCNN提高小目标检测效果的方法,属于目标检测领域。本发明专利技术包括:获取数据集,并按照相应比例划分成训练集及测试集;构建faster‑RCNN模型;利用训练集对模型进行训练,在训练时,若在第n次迭代中,小目标的loss值达到了预设条件,则在第n+1次迭代中,将多张图片进行缩小,然后拼接成原图大小,再进行训练;在训练结束后,利用测试集对模型进行测试,得到AP值,若小于设定的阈值,则修改相应参数,重新训练,直到模型的小目标AP值达到设定的阈值;利用训练好的模型进行小目标的检测。本发明专利技术能够使小目标的分布更加均匀,进而提高小目标训练的充分度,从而提高小目标的检测精度。

【技术实现步骤摘要】
一种基于faster-RCNN提高小目标检测效果的方法
本专利技术涉及目标检测领域,尤其涉及一种基于faster-RCNN提高小目标检测效果的方法。
技术介绍
目标检测即找出图像中所有感兴趣的物体,包含物体定位和物体分类两个子任务,同时确定物体的类别和位置。目标检测是计算机视觉的一个热门研究方向,广泛应用于自动驾驶、智能工业检测、智能监控等诸多领域,通过利用计算机视觉,自动对图片进行处理,减少了人力劳动,具有很强的现实意义。因此,目标检测算法成为近年来的研究热点。近期,比较流行的目标检测算法有两类,一种是One-Stage的目标检测算法,主要有YOLO算法、SSD算法;另一种是Two-Stage的目标检测算法,如faster-RCNN。然而,目标检测在实际的应用中,往往出现小目标的检测效果远不如大目标和中目标。小目标的AP值要比中目标和大目标的AP值低10%到20%,这说明小目标的检测效果不理想。在COCO数据集中,小目标指的是区域面积小于32*32像素,中目标指的是区域面积大于32*32像素且小于96*96像素,大目标指的是区域面积大于96*96像素。COCO数据集是大型的,与目标检测相关的数据集。在COCO数据集中,经统计发现,在所有的检测框中,有41%的检测框是小目标,然而却只有52%的图片中包含了小目标。与之相比,有73%的图片包含中目标,有83%的图片包含大目标。这也就说明了,小目标的数量很多,但分布远不及中目标和大目标均匀。在实验中,小目标的loss较低,这说明对小目标的训练不够充分。因此可以猜测,由于小目标的分布不均匀,导致小目标的loss较低,进而使得小目标训练不够充分,从而导致小目标的检测效果差。同时,目标检测在实际的应用中,往往出现小目标的检测效果远不如大目标和中目标。小目标的AP值要比中目标和大目标的AP值小10%到20%,这说明小目标的检测效果不理想。现有的目标检测算法,如SSD算法、faster-RCNN算法、YOLO算法,小目标的检测效果远不如大目标和中目标的问题还没有一种普适、可靠的算法来解决。
技术实现思路
本专利技术的目的是提供一种基于faster-RCNN提高小目标检测效果的方法,解决小目标检测效果不好的问题,能够提高小目标的检测精度。本专利技术解决其技术问题,采用的技术方案是:一种基于faster-RCNN提高小目标检测效果的方法,包括如下步骤:步骤1、获取数据集,并按照相应比例将数据集划分成训练集及测试集;步骤2、构建faster-RCNN模型;步骤3、利用所述训练集对构建的faster-RCNN模型进行训练,在对模型进行训练的过程中,如果在第n次迭代中,小目标的loss值如果达到了预设条件,那么在第n+1次迭代中,将多张图片进行缩小,然后拼接成原图大小,再进行训练;步骤4、在训练结束后,利用所述测试集对模型进行测试,得到AP值,若得到的AP值小于设定的阈值,则修改相应参数,重新训练,直到模型的小目标AP值达到设定的阈值;步骤5、利用训练好的faster-RCNN模型进行小目标的检测。进一步的是,步骤1中,所述数据集为COCO数据集,所述COCO数据集是一个已经标注好的大型目标检测数据集。进一步的是,步骤1中,所述训练集与测试集的比例为8:2。进一步的是,步骤2中,在构建faster-RCNN模型时,依次搭建Conv层、区域生成网络层、感兴趣区域池化层及分类层;所述Conv层,用于提取图片的特征图;所述区域生成网络层,用于生成检测框,即初步提取图片中目标候选区域;所述感兴趣区域池化层,用于获取Conv层生成的特征图和区域生成网络层生成的目标候选区域,并综合信息后提取候选特征图;所述分类层,用于使用边框回归获得检测框最终的精确位置,以及通过候选特征图判定目标类别。进一步的是,步骤3中,所述预设条件是指:小目标的loss值占全部目标的loss值的比重低于预设阈值范围:其中,LS是小目标的loss值,L是全部目标的loss值,RS是小目标的loss值占全部目标的loss值的比重,所述全部目标包括大目标、中目标及小目标。进一步的是,所述预设阈值范围为0.05-0.3。进一步的是,步骤3中,所述图片的张数为四。进一步的是,步骤3中,对图片的缩小方法如下:w'=w/2,h'=h/2其中,w是原图片宽度,w'是图片缩小后的宽度,h是原图片高度,h'是图片缩小之后的宽度。进一步的是,步骤3中,对缩小后的图片进行拼接时,将宽高缩小为原图的1/2的四张图片,拼成一张与原来图片尺寸相同的图片。进一步的是,步骤4中,所述AP值设定的阈值为23%,当得到的AP值小于设定的阈值时,则修改RS参数,重新训练,直到模型的小目标AP值达到设定的阈值。本专利技术的有益效果是,通过上述一种基于faster-RCNN提高小目标检测效果的方法,在模型的训练过程中,当某次迭代的小目标的loss小于某个阈值时,说明对小目标的训练不充分,那么,在本专利技术中,在下一次的迭代中,通过将图像调整为较小的图像,然后将多张小图拼接成常规尺寸图像,从而使得大目标变成中目标或小目标,中目标变成小目标,使小目标的分布更加均匀,进而提高小目标训练的充分度,从而提高小目标的检测精度。附图说明图1为本专利技术一种基于faster-RCNN提高小目标检测效果的方法的流程图。具体实施方式下面结合附图及实施例,详细描述本专利技术的技术方案。本专利技术提出一种基于faster-RCNN提高小目标检测效果的方法,其流程图见图1,其中,该方法包括如下步骤:步骤1、获取数据集,并按照相应比例将数据集划分成训练集及测试集。步骤2、构建faster-RCNN模型。步骤3、利用训练集对构建的faster-RCNN模型进行训练,在对模型进行训练的过程中,如果在第n次迭代中,小目标的loss值如果达到了预设条件,那么在第n+1次迭代中,将多张图片进行缩小,然后拼接成原图大小,再进行训练。步骤4、在训练结束后,利用测试集对模型进行测试,得到AP值,若得到的AP值小于设定的阈值,则修改相应参数,重新训练,直到模型的小目标AP值达到设定的阈值。步骤5、利用训练好的faster-RCNN模型进行小目标的检测。上述方法中:步骤1中,为了使数据更具代表性,数据集优选为COCO数据集,并且,COCO数据集是一个已经标注好的大型目标检测数据集。需要指出的是,为了利用训练集训练出稳定的模型,且能够利用测试集测试模型的稳定性,训练集与测试集的比例优选为8:2。步骤2中,在构建faster-RCNN模型时,可以依次搭建Conv层、区域生成网络层、感兴趣区域池化层及分类层;其中:Conv层,用于提取图片的特征图;区域生成网络层,用于生成检测框,即初步提取图片本文档来自技高网
...

【技术保护点】
1.一种基于faster-RCNN提高小目标检测效果的方法,其特征在于,包括如下步骤:/n步骤1、获取数据集,并按照相应比例将数据集划分成训练集及测试集;/n步骤2、构建faster-RCNN模型;/n步骤3、利用所述训练集对构建的faster-RCNN模型进行训练,在对模型进行训练的过程中,如果在第n次迭代中,小目标的loss值如果达到了预设条件,那么在第n+1次迭代中,将多张图片进行缩小,然后拼接成原图大小,再进行训练;/n步骤4、在训练结束后,利用所述测试集对模型进行测试,得到AP值,若得到的AP值小于设定的阈值,则修改相应参数,重新训练,直到模型的小目标AP值达到设定的阈值;/n步骤5、利用训练好的faster-RCNN模型进行小目标的检测。/n

【技术特征摘要】
1.一种基于faster-RCNN提高小目标检测效果的方法,其特征在于,包括如下步骤:
步骤1、获取数据集,并按照相应比例将数据集划分成训练集及测试集;
步骤2、构建faster-RCNN模型;
步骤3、利用所述训练集对构建的faster-RCNN模型进行训练,在对模型进行训练的过程中,如果在第n次迭代中,小目标的loss值如果达到了预设条件,那么在第n+1次迭代中,将多张图片进行缩小,然后拼接成原图大小,再进行训练;
步骤4、在训练结束后,利用所述测试集对模型进行测试,得到AP值,若得到的AP值小于设定的阈值,则修改相应参数,重新训练,直到模型的小目标AP值达到设定的阈值;
步骤5、利用训练好的faster-RCNN模型进行小目标的检测。


2.根据权利要求1所述的一种基于faster-RCNN提高小目标检测效果的方法,其特征在于,步骤1中,所述数据集为COCO数据集,所述COCO数据集是一个已经标注好的大型目标检测数据集。


3.根据权利要求1或2所述的一种基于faster-RCNN提高小目标检测效果的方法,其特征在于,步骤1中,所述训练集与测试集的比例为8:2。


4.根据权利要求1所述的一种基于faster-RCNN提高小目标检测效果的方法,其特征在于,步骤2中,在构建faster-RCNN模型时,依次搭建Conv层、区域生成网络层、感兴趣区域池化层及分类层;
所述Conv层,用于提取图片的特征图;
所述区域生成网络层,用于生成检测框,即初步提取图片中目标候选区域;
所述感兴趣区域池化层,用于获取Conv层生成的特征图和区域生成网络层生成的目标候选区域,并综合信息后提取候选特征图;
所...

【专利技术属性】
技术研发人员:王堃王铭宇吴晨
申请(专利权)人:成都恒创新星科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1