The invention belongs to the field of image processing and target detection, and discloses a target classification and a gesture detection method based on a deep convolution neural network. The core contents of the method include: 1. manufacture method of sample set; 2. candidate window generation method; 3. feature extraction method; 4. network training method; 5. target annotation method. The image to be detected by convolutional neural network to get the depth of convolution characteristics, the candidate will have the attitude angle to the window mapping feature layer, get the feature vector direction, classify and forecast to get final results by the feature vector. The method can extract more pure target features from the samples, which can improve the classification accuracy and achieve the target angle detection function.
【技术实现步骤摘要】
一种基于深度卷积神经网络的目标分类及姿态检测方法
本专利技术属于图像处理与目标检测领域,公开了一种基于深度卷积神经网络的目标分类及姿态检测方法。
技术介绍
目标检测需要在给定的图像上精确地标记目标所在位置,并识别出物体的种类。目标尺寸大小不定、目标在图像当中的位置不定、目标的姿态角度不定以及背景光照变化等将会对检测过程造成困难,导致检测正确率下降。经典的目标检测方法通常采用模板匹配加滑动窗口的方式来解决目标在图像中的识别和定位问题,这种方法耗时长且在目标变化剧烈的情况下效果较差。卷积神经网络的出现带动了这一课题的发展,大幅提高了检测精度(mAP)。纽约大学的PierreSermanet等人提出的Overfeat网络采用多尺度的滑动窗口在同一卷积特征图上进行目标定位和识别,但该方法效果和速度都不尽如人意。RossGirshick等人提出的RCNN方法基于选择性搜索方法(Selectivesearch)预测物体可能存在的区域,但存在着仿射变换破坏候选区域特征的问题。SPP-NET方法和FastRCNN方法仍然通过选择性搜索的方式生成候选区域,利用图像金字塔机制解决了候选区域的尺度映射问题,同时实现了多阶段连续训练。FasterRCNN用一个单独的区域生成网络代替了选择性搜索的方法,解决了候选区域生成过程耗费大量时间的问题,加快了网络的训练速度和测试速度,也提高了检测结果的准确性。根据上述每种方法的专利技术者撰写的学术论文内容显示,目前目标检测方法通常所采用的选框为与图像的四条边框分别平行的正立矩形,这种形式的选框仅对处于正立姿态角的目标(目标的几何中心线与图像 ...
【技术保护点】
一种基于深度卷积神经网络的目标分类及姿态检测方法,其特征在于包括以下步骤:a)制作样本集,包括训练集和测试集,每张样本图像可包含多个目标,每个目标用六个参数(l,x,y,h,w,θ)进行表示,l代表该目标的标签,x和y代表目标中心在图像中的横纵坐标,h和w代表目标真值窗口的高和宽,θ表示目标相对于基准轴的姿态角;b)候选窗口生成过程,在整幅图像上以一定步长均匀生成候选窗口,窗口采用不同尺寸和不同姿态角的矩形框;c)深度特征提取过程,先将待检测的图像输入到预先训练的模型进行计算得到深度卷积特征图,将b)当中生成的候选窗口依据图像金字塔的机制映射到深度卷积特征图上面生成固定维度的特征向量;d)子网络构建过程,在获得的卷积特征层的基础上,构建三个子网络分别用于识别目标种类、修正候选窗口位置和预测目标姿态角,对于网络中新添加的层,采用Xavier初始化方法建立参数;e)训练样本的生成过程,样本中不仅包含图像,还包含候选窗口的正负样本,正负样本依据候选窗口与真值窗口的重叠比例(IOU)进行划分,使样本集中正负样本比例接近于1:1;f)网络训练过程,通过批量随机梯度下降法对网络参数进行调整,每次训 ...
【技术特征摘要】
1.一种基于深度卷积神经网络的目标分类及姿态检测方法,其特征在于包括以下步骤:a)制作样本集,包括训练集和测试集,每张样本图像可包含多个目标,每个目标用六个参数(l,x,y,h,w,θ)进行表示,l代表该目标的标签,x和y代表目标中心在图像中的横纵坐标,h和w代表目标真值窗口的高和宽,θ表示目标相对于基准轴的姿态角;b)候选窗口生成过程,在整幅图像上以一定步长均匀生成候选窗口,窗口采用不同尺寸和不同姿态角的矩形框;c)深度特征提取过程,先将待检测的图像输入到预先训练的模型进行计算得到深度卷积特征图,将b)当中生成的候选窗口依据图像金字塔的机制映射到深度卷积特征图上面生成固定维度的特征向量;d)子网络构建过程,在获得的卷积特征层的基础上,构建三个子网络分别用于识别目标种类、修正候选窗口位置和预测目标姿态角,对于网络中新添加的层,采用Xavier初始化方法建立参数;e)训练样本的生成过程,样本中不仅包含图像,还包含候选窗口的正负样本,正负样本依据候选窗口与真值窗口的重叠比例(IOU)进行划分,使样本集中正负样本比例接近于1:1;f)网络训练过程,通过批量随机梯度下降法对网络参数进行调整,每次训练需至少输入一幅图像,保证正样本数量的前提下随机抽取负样本,在训练起始阶段通过较大学习率对参数进行更新,在网络输出误差减小缓慢时减小学习率;g)目标标注步骤,输入一幅待检测图像,利...
【专利技术属性】
技术研发人员:刘明,杜浩源,董立泉,赵跃进,刘小华,惠梅,孔令琴,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。