一种基于全卷积分裂网络的目标检测方法技术

技术编号:16645366 阅读:113 留言:0更新日期:2017-11-26 18:32
本发明专利技术提供了一种基于全卷积分裂网络的目标检测方法,对图片进行预处理:将搜集到的数据集中的图片进行随机抽取裁剪,具体剪裁方法为:取图片长宽的设定大小的预置框,在图片中选取5处裁剪预置框大小的图片,分别为图片的四角和中心位置,将对应目标的目标框映射到处理后的图片,得到训练图片。与现有技术相比,在计算资源损耗方面是当前网络模型(比如VGG网络)的1/100;在运算时间方面提速了300倍,极大提升了运算效率;在检测性能方面,本方法能有效检测到道路上出现的大小目标,达到了速度与精度的平衡。

【技术实现步骤摘要】
一种基于全卷积分裂网络的目标检测方法
本专利技术涉及一种计算机视觉目标检测领域,特别是涉及一种适用于基于全卷积分裂网络的目标检测方法。
技术介绍
视觉是人类获取信息的主要方式,人类获取的信息有70%来自视觉信息。随着社会的发展,智能感知传感器的分布越来越广泛,我们可以从这些传感器中获得大量的信息。人类可以从复杂的环境中准确的定位和检测到物体,这是人类视觉的基本的功能。计算机视觉中的目标检测,旨在利用计算机对自然图片中的目标进行检测和定位,是目标跟踪和大量后续工作的基础。具有极其重要的研究价值。在学术界和工业界,研究目标检测的算法是十分重要的,但是在计算机视觉领域,现有的目标检测算法仍然存在着十分重要的缺陷。比如,无法满足实时性,算法运行时资源消耗巨大。随着卷积神经网络的发展,基于卷积神经网络的分类方法在图像分类问题上面有着优异的表现,现有19层的VGG网络将1000类的分类挑战的精度突破到了7.3%;22层的GoogleNet网络将分类精度突破到了6.7%.到了2015年,由何凯明专利技术的152层残差网络将分类误差降低到了3.57%.然而随着网络的不断深入发展,卷积神经网络的深度在本文档来自技高网...
一种基于全卷积分裂网络的目标检测方法

【技术保护点】
一种基于全卷积分裂网络的目标检测方法,具体方法包括:对图片进行预处理:将搜集到的数据集中的图片进行随机抽取裁剪,具体剪裁方法为:取图片长宽的设定大小的预置框,在图片中选取5处裁剪预置框大小的图片,分别为图片的四角和中心位置,将对应目标的目标框映射到处理后的图片,得到训练图片;特征提取阶段特征提取部分的特征提取网络结构为:特提取网络的层数为9层卷积层;其中,有n层卷积层后级联一个用于降采样的池化层;两个滤波器的输出大小分别为1x1和3x3;其中,n为大于等于1小于等于9的自然数;在目标检测阶段,在特征提取网络后级联6个的卷积层,构成检测网络,每个卷积层直接输出目标的位置信息和类别信息;在检测网络...

【技术特征摘要】
1.一种基于全卷积分裂网络的目标检测方法,具体方法包括:对图片进行预处理:将搜集到的数据集中的图片进行随机抽取裁剪,具体剪裁方法为:取图片长宽的设定大小的预置框,在图片中选取5处裁剪预置框大小的图片,分别为图片的四角和中心位置,将对应目标的目标框映射到处理后的图片,得到训练图片;特征提取阶段特征提取部分的特征提取网络结构为:特提取网络的层数为9层卷积层;其中,有n层卷积层后级联一个用于降采样的池化层;两个滤波器的输出大小分别为1x1和3x3;其中,n为大于等于1小于等于9的自然数;在目标检测阶段,在特征提取网络后级联6个的卷积层,构成检测网络,每个卷积层直接输出目标的位置信息和类别信息;在检测网络中,改变其中两个卷积层的卷积核的大小由原来的3x3改为2x4和4x2。2.根据权利要求1所述的基于全卷积分裂网络的目标检测方法,所述设定大小的预置框为图片长宽的1/3大小...

【专利技术属性】
技术研发人员:李宏亮
申请(专利权)人:成都快眼科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1