【技术实现步骤摘要】
一种基于全卷积分裂网络的目标检测方法
本专利技术涉及一种计算机视觉目标检测领域,特别是涉及一种适用于基于全卷积分裂网络的目标检测方法。
技术介绍
视觉是人类获取信息的主要方式,人类获取的信息有70%来自视觉信息。随着社会的发展,智能感知传感器的分布越来越广泛,我们可以从这些传感器中获得大量的信息。人类可以从复杂的环境中准确的定位和检测到物体,这是人类视觉的基本的功能。计算机视觉中的目标检测,旨在利用计算机对自然图片中的目标进行检测和定位,是目标跟踪和大量后续工作的基础。具有极其重要的研究价值。在学术界和工业界,研究目标检测的算法是十分重要的,但是在计算机视觉领域,现有的目标检测算法仍然存在着十分重要的缺陷。比如,无法满足实时性,算法运行时资源消耗巨大。随着卷积神经网络的发展,基于卷积神经网络的分类方法在图像分类问题上面有着优异的表现,现有19层的VGG网络将1000类的分类挑战的精度突破到了7.3%;22层的GoogleNet网络将分类精度突破到了6.7%.到了2015年,由何凯明专利技术的152层残差网络将分类误差降低到了3.57%.然而随着网络的不断深入发展, ...
【技术保护点】
一种基于全卷积分裂网络的目标检测方法,具体方法包括:对图片进行预处理:将搜集到的数据集中的图片进行随机抽取裁剪,具体剪裁方法为:取图片长宽的设定大小的预置框,在图片中选取5处裁剪预置框大小的图片,分别为图片的四角和中心位置,将对应目标的目标框映射到处理后的图片,得到训练图片;特征提取阶段特征提取部分的特征提取网络结构为:特提取网络的层数为9层卷积层;其中,有n层卷积层后级联一个用于降采样的池化层;两个滤波器的输出大小分别为1x1和3x3;其中,n为大于等于1小于等于9的自然数;在目标检测阶段,在特征提取网络后级联6个的卷积层,构成检测网络,每个卷积层直接输出目标的位置信息和 ...
【技术特征摘要】
1.一种基于全卷积分裂网络的目标检测方法,具体方法包括:对图片进行预处理:将搜集到的数据集中的图片进行随机抽取裁剪,具体剪裁方法为:取图片长宽的设定大小的预置框,在图片中选取5处裁剪预置框大小的图片,分别为图片的四角和中心位置,将对应目标的目标框映射到处理后的图片,得到训练图片;特征提取阶段特征提取部分的特征提取网络结构为:特提取网络的层数为9层卷积层;其中,有n层卷积层后级联一个用于降采样的池化层;两个滤波器的输出大小分别为1x1和3x3;其中,n为大于等于1小于等于9的自然数;在目标检测阶段,在特征提取网络后级联6个的卷积层,构成检测网络,每个卷积层直接输出目标的位置信息和类别信息;在检测网络中,改变其中两个卷积层的卷积核的大小由原来的3x3改为2x4和4x2。2.根据权利要求1所述的基于全卷积分裂网络的目标检测方法,所述设定大小的预置框为图片长宽的1/3大小...
【专利技术属性】
技术研发人员:李宏亮,
申请(专利权)人:成都快眼科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。