目标检测模型构建方法技术

技术编号:15983267 阅读:35 留言:0更新日期:2017-08-12 05:48
本发明专利技术涉及一种目标检测模型构建方法,包括以下步骤:步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;步骤3,输出训练完成后的目标检测模型。本发明专利技术中,有效地提升了对目标检测的准确度。

【技术实现步骤摘要】
目标检测模型构建方法
本专利技术属于计算机视觉领域,具体涉及一种目标检测模型构建方法。
技术介绍
目标检测是计算机视觉中的经典问题之一,也是基于视觉的模式识别应用的一个重要研究方向。它需要对任意画面进行搜索,对画面中存在的目标进行有效的标注以及外接矩形框提取。由于需要对画面中呈现出多样性姿态的目标进行有效检出,因此需要目标的特征表示具有极强的表达能力和判别力。而传统的基于图像局部统计特性表达的手工设计特征难以区分目标的多样性、复杂性,其难以在一般性的目标检测问题上达到较好的效果。深度学习是近年来机器学习领域一个热门研究方向,已经在计算机视觉、自然语言处理等领域获得了巨大的成功。尤其是深度卷积神经网络,凭借局部感受野、共享权值以及空间或时序下采样这三大结构特点,能够从二维图像中提取出语义信息丰富和判别力强的特征,在大规模图像分类和检索任务中均表现出优越的性能。近两年,已经出现一些将深度学习应用于专用的目标检测的技术,如CN104537647A利用深度学习模型的最后一层隐节点的状态值训练分类器,用于改善行人检测问题;CN105718912A采用传统方法和深度学习方法相结合的方式进行车辆检测,其利用传统方法提取目标候选区域,并在候选区域的基础上利用深度学习模型进行后续的特征提取以及目标类别判别。现有的基于深度学习的一般性目标检测技术尚有以下不足:首先,一般的检测方法在其前端、或后端均结合了传统方法进行辅助,其采用的深度神经网络难以实现端到端的设计,从而提高了深度学习模型的训练难度,使得模型难以收敛;其次,由于图像中一般性目标的姿态呈现出多样性,如在一幅图像中可能出现一个人躺在沙发上看电视的场景,该图中人、沙发、电视分别呈现出截然不同的长宽比例、外观表现等形式,采用如行人、车辆等固定比例框的方式对目标外接矩形框进行预测难以有效的对目标的紧致位置表达;另外,图像中存在的不同类物体,由于其姿态、尺度的巨大差异,可能呈现出巨大的外观差异,如一幅图像中出现一个人弯腰捡起地下瓶子的场景,瓶子相对于图像尺寸呈现出非常小的尺度,由于深度神经网络具有层级卷积下采样的特性,其在处理小目标时采用单级判别的方式难以对小目标进行有效地提取。因此,上述已有的针对特定目标的检测方法在处理一般性目标检测问题难以同时处理目标外观、比例、尺度差异较大等问题,在进行一般性目标检测时判别力较为不足。
技术实现思路
为了解决现有技术中的上述问题,本专利技术提出了一种目标检测模型构建方法,有效提升目标检测准确度。该构建方法包括以下步骤:步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;步骤3,输出训练完成后的目标检测模型。优选地,所述深度卷积神经网络为输入原始图像,输出图像中目标定位矩形框左上角和右下角坐标及其对应的目标类别的神经网络结构。优选地,所述步骤2包括:步骤21,根据所述目标检测定位数据集做卷积特征和反卷积特征提取,得到图像稠密特征;步骤22,对所述图像稠密特征进行物体性目标提取,得到物体性检测结果;步骤23,利用非极大抑制处理对所述物体性检测结果进行重复过滤;步骤24,利用自适应尺度选择对过滤后的物体性检测结果做自动特征尺度映射处理,得到不同尺度的物体性目标;步骤25,根据感兴趣区域池化操作,在所述不同尺度的物体性目标中提取具有固定维度的目标特征;步骤26,利用自适应空间仿射变换层对所述具有固定维度的目标特征进行标准化映射;步骤27,根据不同维度的目标特征对不同尺度的物体性目标进行外接矩形框坐标回归处理;步骤28,根据不同维度的目标特征和所述图像稠密特征对所述待检测目标类别进行判别。优选地,所述步骤21具体为:对所述目标检测定位数据集做图片的高分辨率特征提取,将卷积特征、反卷积特征进行采样串联得到图像的稠密特征。优选地,所述步骤22具体为:在进行物体性目标提取时,对物体性目标检测输出特征图的预测结果进行筛选,选取和待检测目标真实坐标重合度最大、且分类得分最高的预测结果组成困难样本集。优选地,所述步骤24具体为:对物体性检测结果进行尺度自适应映射,将不同尺度目标映射至不同深度特征中,得到不同尺度的物体性目标。优选地,所述外接矩形坐标回归处理中的外接矩形坐标回归特征由不同尺度对应深度学习特征层构成;目标类别判别中的目标类别判别特征由对应层深度学习特征同物体性判别对应特征串联组成。优选地,将所述步骤27的回归处理和步骤28的类别判别处理做联合优化处理,所述优化处理具体为输入单张图片,在线选取分类和坐标回归损失最大的目标样本参与多个损失计算,并针对每张图片将其在多个损失中对应的梯度累加,并进行一次梯度反传。与现有技术相比,本专利技术至少具有以下优点:通过本专利技术中目标检测模型的构建设计,有效地提升了对目标检测的准确度。附图说明图1为本专利技术所提供的目标检测模型构建方法的流程示意图;图2为本专利技术所提供的目标检测深度神经网络总体结构示意图;图3为本专利技术所提供的目标检测深度神经网络子网络示意图。具体实施方式下面参照附图来描述本专利技术的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本专利技术的技术原理,并非旨在限制本专利技术的保护范围。本专利技术实施例包括目标检测模型构建方法,如图1所示,该方法包括以下步骤:步骤A1,图片中待检测目标的位置标注。选取包含有待检测目标的图片,对各待检测目标的图片进行目标位置标注,具体为绘制图片中包含各待检测目标的最小矩形框,记录该矩形框的左上角和右下角坐标信息,形成目标检测定位数据集。其中,目标图片的来源可以有很多种方式,比如从网络上收集或自行拍摄,目标图片需要包含目标的50%以上;本实施例中采用手工标注的方式对图片进行目标位置标注,当然这只是其中一种标注方式,其它任意能够实现在图片中对待检测目标进行标注的方式均包含在本专利技术的范围之内。步骤A2,对深度卷积神经网络进行训练。利用目标检测定位数据集,训练用于目标检测深度卷积神经网络,并输出训练好的用于目标检测的深度卷积神经网络。其中,所述深度卷积神经网络具有端到端的特点,其输入为原始图像,输出为图像中目标定位矩形框左上角和右下角坐标以及其对应的目标类别。在步骤A2中深度卷积神经网络训练过程中的损失分别有多级采用分类损失以及平滑1-范数(L1)损失加权组成;所述深度卷积神经网络由级联的多层监督组成,不同的网络监督层对应输出分类损失以及平滑L1损失,不同的网络输出层共同组成深度神经网络最终的检测损失。为了加快用于目标检测的深度卷积神经网络的训练速度,在步骤A2中利用在线困难样本挖掘策略和一种改进的端到端的梯度反传优化算法来加快用于目标检测的深度卷积神经网络的收敛。本实施案例所涉及的用于目标检测的深度卷积神经网络总体结构示意图如图1所示,由卷积子网络和后续的多层特征提取、物体性目标判别、尺度自适应、仿射变换校正、感兴趣区域池化、目标分类回归、非极大抑制等部分组成。其中物体性目标判别、以及目标分类、本文档来自技高网
...
目标检测模型构建方法

【技术保护点】
一种目标检测模型构建方法,其特征在于,包括以下步骤:步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;步骤3,输出训练完成后的目标检测模型。

【技术特征摘要】
1.一种目标检测模型构建方法,其特征在于,包括以下步骤:步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;步骤3,输出训练完成后的目标检测模型。2.根据权利要求1所述的目标检测模型构建方法,其特征在于,所述深度卷积神经网络为输入原始图像,输出图像中目标定位矩形框左上角和右下角坐标及其对应的目标类别的神经网络结构。3.根据权利要求2所述的目标检测模型构建方法,其特征在于,所述步骤2包括:步骤21,根据所述目标检测定位数据集做卷积特征和反卷积特征提取,得到图像稠密特征;步骤22,对所述图像稠密特征进行物体性目标提取,得到物体性检测结果;步骤23,利用非极大抑制处理对所述物体性检测结果进行重复过滤;步骤24,利用自适应尺度选择对过滤后的物体性检测结果做自动特征尺度映射处理,得到不同尺度的物体性目标;步骤25,根据感兴趣区域池化操作,在所述不同尺度的物体性目标中提取具有固定维度的目标特征;步骤26,利用自适应空间仿射变换层对所述具有固定维度的目标特征进行标准化映射;步骤27,根据不同维度的目标特征对不同尺度...

【专利技术属性】
技术研发人员:王金桥赵朝阳
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1