The present invention relates to a method of key target detection and extraction in driving scene based on in-depth learning, which is characterized by improving single multi-frame detector to detect, annotate and select key targets in driving scene. The training process of the improved single multi-frame detector is as follows: 1) acquiring training set; 2) generating a priori box and corresponding priori box. The real objects with class labels and frame labels are matched to form positive and negative samples. 3) The model parameters of a single multi-frame detector are updated iteratively by using loss function, which is realized by gradient updating based on momentum optimization. Compared with the prior art, the invention has the advantages of high detection accuracy and small target detection.
【技术实现步骤摘要】
一种基于深度学习的自动驾驶场景关键目标检测提取方法
本专利技术涉及一种自动驾驶场景目标检测方法,尤其是涉及一种基于深度学习的自动驾驶场景关键目标检测提取方法。
技术介绍
随着深度学习技术在图像与视频领域的飞速发展,一系列与深度学习相关的目标检测算法优势逐渐显现。在处理驾驶视野场景或者其他较为复杂的检测场景时,基于深度学习与视觉的目标识别与检测算法有相当大的应用空间。无人驾驶视觉感知技术中已经有部分基于深度网络的目标检测算法被提出,将深度学习应用于驾驶场景下的目标检测已经成为当前的研究热点。早期的研究将多尺度卷积神经网络应用于交通标志分类任务中,取得高准确率。之后有大量研究针对单目视觉下,借助CNN(ConvolutionalNeuralNetwork)特征提取框架与对象区域提议框,同时利用传统机器学习的各种分类器,基本实现自动驾驶下的目标识别。目前部分研究提出利用新的多任务学习(Multi-TaskLearning,MTL)方法,用基于笛卡尔积的多任务组合策略对目标检测和距离预测联合建模,实现自动驾驶中的特定危险目标的检测。也有部分研究通过添加语义信息辅助检测,改进原始卷积神经网络的结构,提高行人检测的准确率与效率。最近有部分研究提出了利用较新的深度物体检测框架如R-FCN,并改进其网络结构,实现自动驾驶场景下的交通标志检测。基于深度神经网络的目标检测技术能够有效地自动的从图像中提取特征信息,并完成目标的识别与框选,因此该技术在无人驾驶视觉识别问题中取得了令人满意的实验结果。尽管如此,该技术目前还存在以下缺陷:第一,现有研究大都针对行人、交通标志或障碍物等 ...
【技术保护点】
1.一种基于深度学习的自动驾驶场景关键目标检测提取方法,其特征在于,该方法基于改进单次多框检测器进行驾驶场景中的关键目标检测、语义标注和目标框选,所述改进单次多框检测器的训练过程具体为:1)获取训练集;2)生成先验框,将先验框与对应图片的带有类标和框标注的真实目标进行匹配,形成正负样本;3)利用损失函数迭代更新单次多框检测器的模型参数,所述迭代更新基于动量优化的梯度更新实现。
【技术特征摘要】
1.一种基于深度学习的自动驾驶场景关键目标检测提取方法,其特征在于,该方法基于改进单次多框检测器进行驾驶场景中的关键目标检测、语义标注和目标框选,所述改进单次多框检测器的训练过程具体为:1)获取训练集;2)生成先验框,将先验框与对应图片的带有类标和框标注的真实目标进行匹配,形成正负样本;3)利用损失函数迭代更新单次多框检测器的模型参数,所述迭代更新基于动量优化的梯度更新实现。2.根据权利要求1所述的基于深度学习的自动驾驶场景关键目标检测提取方法,其特征在于,所述基于动量优化的梯度更新公式为:v'dW=μvdW+(1-μ)dWv'db=μvdb+(1-μ)dbW'=W-ηv'dWb'=b-ηv'db其中,W和b分别为当前的权重项和常数项,W'和b'分别为更新后的权重项和常数项,dW和db为加速项,vdW和vdb分别为当前权重项和常数项的动量项,v'dW和v'db分别为更新后的权重项和常数项的动量项,μ为动量因子,η为学习率。3.根据权利要求1所述的基于深度学习的自动驾驶场景关键目标检测提取方法,其特征在于,所述迭代更新过程中,采用三段阶梯式学习率下降策略获得学习率:式中,d1、d2、d3分别为三阶段的学习率下降因子,ls为训练的初始学习率,t为训练的迭代步数,t1、t2分别为三阶段的学习率下降边界。4.根据权利要求1所述的基于深度学习的自动驾驶场景关键目标检测提取方法,其特征在于,所述生成先验框时,针对大检测目标,Conv4_3、Conv10_2和Conv11_2层生成的特征图仅使用4个先验框;针对小检测目标,Conv7...
【专利技术属性】
技术研发人员:张雪芹,魏一凡,顾秋晨,
申请(专利权)人:华东理工大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。