一种基于全卷积分裂网络的目标检测方法技术

技术编号：16645366 阅读：113 留言：0更新日期：2017-11-26 18:32

本发明专利技术提供了一种基于全卷积分裂网络的目标检测方法，对图片进行预处理：将搜集到的数据集中的图片进行随机抽取裁剪，具体剪裁方法为：取图片长宽的设定大小的预置框，在图片中选取5处裁剪预置框大小的图片，分别为图片的四角和中心位置，将对应目标的目标框映射到处理后的图片，得到训练图片。与现有技术相比，在计算资源损耗方面是当前网络模型（比如VGG网络）的1/100；在运算时间方面提速了300倍，极大提升了运算效率；在检测性能方面，本方法能有效检测到道路上出现的大小目标，达到了速度与精度的平衡。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全卷积分裂网络的目标检测方法
本专利技术涉及一种计算机视觉目标检测领域，特别是涉及一种适用于基于全卷积分裂网络的目标检测方法。
技术介绍
视觉是人类获取信息的主要方式，人类获取的信息有70%来自视觉信息。随着社会的发展，智能感知传感器的分布越来越广泛，我们可以从这些传感器中获得大量的信息。人类可以从复杂的环境中准确的定位和检测到物体，这是人类视觉的基本的功能。计算机视觉中的目标检测，旨在利用计算机对自然图片中的目标进行检测和定位，是目标跟踪和大量后续工作的基础。具有极其重要的研究价值。在学术界和工业界，研究目标检测的算法是十分重要的，但是在计算机视觉领域，现有的目标检测算法仍然存在着十分重要的缺陷。比如，无法满足实时性，算法运行时资源消耗巨大。随着卷积神经网络的发展，基于卷积神经网络的分类方法在图像分类问题上面有着优异的表现，现有19层的VGG网络将1000类的分类挑战的精度突破到了7.3%；22层的GoogleNet网络将分类精度突破到了6.7%.到了2015年，由何凯明专利技术的152层残差网络将分类误差降低到了3.57%.然而随着网络的不断深入发展，...
一种基于全卷积分裂网络的目标检测方法

【技术保护点】
一种基于全卷积分裂网络的目标检测方法，具体方法包括：对图片进行预处理：将搜集到的数据集中的图片进行随机抽取裁剪，具体剪裁方法为：取图片长宽的设定大小的预置框，在图片中选取5处裁剪预置框大小的图片，分别为图片的四角和中心位置，将对应目标的目标框映射到处理后的图片，得到训练图片；特征提取阶段特征提取部分的特征提取网络结构为：特提取网络的层数为9层卷积层；其中，有n层卷积层后级联一个用于降采样的池化层；两个滤波器的输出大小分别为1x1和3x3；其中，n为大于等于1小于等于9的自然数；在目标检测阶段，在特征提取网络后级联6个的卷积层，构成检测网络，每个卷积层直接输出目标的位置信息和类别信息；在检测网络...

【技术特征摘要】
1.一种基于全卷积分裂网络的目标检测方法，具体方法包括：对图片进行预处理：将搜集到的数据集中的图片进行随机抽取裁剪，具体剪裁方法为：取图片长宽的设定大小的预置框，在图片中选取5处裁剪预置框大小的图片，分别为图片的四角和中心位置，将对应目标的目标框映射到处理后的图片，得到训练图片；特征提取阶段特征提取部分的特征提取网络结构为：特提取网络的层数为9层卷积层；其中，有n层卷积层后级联一个用于降采样的池化层；两个滤波器的输出大小分别为1x1和3x3；其中，n为大于等于1小于等于9的自然数；在目标检测阶段，在特征提取网络后级联6个的卷积层，构成检测网络，每个卷积层直接输出目标的位置信息和类别信息；在检测网络中，改变其中两个卷积层的卷积核的大小由原来的3x3改为2x4和4x2。2.根据权利要求1所述的基于全卷积分裂网络的目标检测方法，所述设定大小的预置框为图片长宽的1/3大小...

【专利技术属性】
技术研发人员：李宏亮，
申请(专利权)人：成都快眼科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人