【技术实现步骤摘要】
一种基于深度学习的无人驾驶车辆目标检测方法
本专利技术属于目标检测识别领域,具体涉及一种基于深度学习的无人驾驶车辆目标检测方法。
技术介绍
随着科学技术的快速发展,汽车逐渐成为人民群众日常生活中不可或缺的交通工具。汽车产业已经成为世界上最重要的行业之一,并成为很多国家的支柱性产业。汽车保有量的迅猛增加虽然给群众的日常生活带来了便利,但是却导致了交通拥堵、环境污染和交通事故。交通事故问题显得尤为重要,每年全球因道路交通事故死亡的人数超过130多万。大部分的交通事故是由于人的操作失误、酒驾和疲劳驾驶造成的。驾驶员面对道路突发状况时,由于感知和操控能力的局限性,导致人类很难在短时间内识别道路状况并做出合理的决策,这也是造成交通事故的重要原因之一。近年来,无人驾驶车辆在汽车应用领域和科学研究领域都取得了非常多的成就,他们更多的是使用昂贵的雷达系统和很多个摄像头去感知周围的环境。随着人工智能的发展,利用低廉的车载相机进行自动驾驶成为可能。由于自动驾驶车辆需要根据周围物体的类别来做作出不同的决策,因此目标检测是自动驾驶领域的核心 ...
【技术保护点】
1.一种基于深度学习的无人驾驶车辆目标检测方法,其特征在于,包括以下步骤:/n步骤(1):生成目标物体的三维模板,并对目标物体进行采样,然后结合生成的三维模板和物体采样策略对输入的图像生成候选框;/n步骤(2):对步骤(1)生成的候选框进行特征提取,并构建目标函数;/n步骤(3):基于步骤(2)得到的目标函数,使用结构化支持向量机分类器完成对目标函数权值的训练和目标物体的初步检测;/n步骤(4):改进区域候选网络,构建效率更高的HRPN网络,提升区域候选框质量和网络训练速度;/n步骤(5):基于构建的HRPN网络,训练Faster R-CNN检测模型,再将步骤(3)得到的初 ...
【技术特征摘要】
1.一种基于深度学习的无人驾驶车辆目标检测方法,其特征在于,包括以下步骤:
步骤(1):生成目标物体的三维模板,并对目标物体进行采样,然后结合生成的三维模板和物体采样策略对输入的图像生成候选框;
步骤(2):对步骤(1)生成的候选框进行特征提取,并构建目标函数;
步骤(3):基于步骤(2)得到的目标函数,使用结构化支持向量机分类器完成对目标函数权值的训练和目标物体的初步检测;
步骤(4):改进区域候选网络,构建效率更高的HRPN网络,提升区域候选框质量和网络训练速度;
步骤(5):基于构建的HRPN网络,训练FasterR-CNN检测模型,再将步骤(3)得到的初步检测结果输入网络进行训练,训练结束后将模型参数信息和结构信息保存,用于进行目标检测。
2.根据权利要求1所述的方法,其特征在于,步骤(1)所述生成目标物体的三维模板,并对目标物体进行采样,然后结合生成的三维模板和物体采样策略对输入的图像生成候选框,具体包括如下步骤:
步骤(1-1):根据数据集图像的标注信息构建目标类的模板;
步骤(1-2):基于步骤(1-1)得到的不同目标类模板后,在输入图像上对目标物体进行采样,并生成候选框。
3.根据权利要求2所述的方法,其特征在于,所述步骤(1-1)具体包括如下步骤:
步骤(1-1-1):根据物体标注信息,提取物体在所有输入图像中的标注框的参数,即长为m,宽为n,高为z;
步骤(1-1-2):根据每个标注框的长宽高参数,计算数据集标注物体分类函数g(m,n,z)的值,将g(m,n,z)值相同的标注框归为一类;g(m,n,z)公式如下:
g(m,n,z)=10m+n+100z(1);
步骤(1-1-3):对每一类标注信息的参数m,n,z分别求平均值,得到每一类的标注信息长宽高的平均值,即长度的平均值为mave,宽度的平均值为nave,高度的平均值为zave,以出现标注框信息最多的类对应的mave,nave,zave作为模板,计算标注框出现频率最高类的mave,nave,zave与其他类标注框m,n,z的平均值的交并比IOU;交并比公式如下所示:
其中V1是第一个标注框的体积,V2是第二个标注框的体积;
步骤(1-1-4):当重叠度大于或等于指定类的阈值时,将此类和标注信息出现频率最高的类合并为一类,然后重复操作步骤(1-3);其中,目标类汽车的阈值为0.7,目标类行人的阈值为0.6,目标类骑自行车的人的阈值为0.65。
4.根据权利要求2所述的方法,其特征在于,所述步骤(1-2)具体包括如下步骤:
步骤(1-2-1):单目图像,缺少图像的深度信息,无法准确的估计地平面,因此取摄像机距离地面的高度为1.65m;
步骤(1-2-2):生成候选框;将输入图像沿m,n,z三个方向离散化,体积元素大小设置为0.2m,由于检测目标均在地平面上,所以在输入图像的地平面上对候选框进行穷尽搜索;
步骤(1-2-3):对候选框进行优化;经过步骤(1-2-2),已经生成足够多的的候选框,将只有道路信息、距离地面很高的候选框丢弃掉;若采样的候选框中都是道路信息或者候选框的位置先验概率低于某一个阈值,也将这些候选框直接丢弃。
5.根据权利要求1所述的方法,其特征在于,所述步骤(2)对步骤(1)生成的候选框进行特征提取,并构建目标函数;具体如下:
使用一组参数(m,n,z,θ,c,r)表示三维候选框,其中(m,n,z)是候选框的中心位置坐标,θ表示目标物体的方向角,c表示目标物体的类别,r表示相应的候选框模板集合;其中θ∈{0,90},c∈{Car,Pedestrain,Cyclist},r∈{1,2…Rc},其中Rc表示目标物体的种类数量;
基于提取到的特征设计目标函数F(m,n),公式如下:
其中,(m,n)表示位于摄像机视角内的目标物体位置坐标,c表示目标物体的类别,和分别为特征和对应的权值,它们的取值由训练时进行初始化,并随训练过程不断调整,以得到最优解,另外和来源于语义分割特征和实例分割特征,表示对应目标种类特征的权值,表示目标种类特征的值,此处目标种类为Car,Pedestrain和Cyclist。
6.根据权利要求5所述的方法,其特征在于,所述语义分割特征是像素级别的物体分类,结合六种类型的特征来表示语义分割特征:
第一个特征为表示区域候选框内标记为目标类的像素占区域候选框中总像素的百分比,公式如下:
其中Ω(n)指3D区域候选框沿n方向投影到地面上后得到的2D框的像素图,若Sc(j)属于候选框内标记目标类别的像素,则值为1,否则值为0,j表示计数变量,j∈Ω(n);
第二个特征为表示区域候选框内标记为道路信息的像素占区域候选框中总像素的百分比,公式如(5)所示:
其中,若Sroad(j)属于道路信息像素,则值为1,否则值为0;
第三个特征为表示区域候选框内标记为背景的像素占区域候选框中总像素的百分比,公式如(6)所示:
其中,若Sbg(j)属于区域候选框中的背景信息像素,则值为1,否则值为0;
第四个特征为表示鸟瞰视角下道路信息的像素数占鸟瞰视角下投影框的总像素的百分比,公式如下:
其中,若Sroad_3d(j)属于鸟瞰视角下的道路信息像素,则值为1,否则值为0;
再将区域候选框的高度向下扩展原高度的1/4,宽度保持不变,然后对区域候选框的上下文区域进行编码,对于扩大后的区域候选框,上下文区域中语义分割图像的道路信息和背景信息计算公式如下:
其中,若Sctx_road(j)属于扩大后的区域候选框道路信息像素,则值为1,否则值为0,若Sctx_bg(j)属于扩大后的区域候选框中的背景信息像素,则值为1,否则值为0;
所述实例分割特征是在物体检测的基础上,分割出物体的像素,将图中的每一个像素都区别为不同的类别,同时还在不同类别的基础上区分开不同的实例;利用实例级别的分割特征,计算框内和框外的实例像素数量,并进行打分。
7.根据权利要求1所述的方法,其特征在于,所述步骤(3)基于步骤(2)得到的目标函数,使用结构化支持向量机分类器完成对目标函数权值的训练和目标物体的初步检测;具体过程为:
首先对输入图像标注信息中的长宽高进行处理,对每一个目标类得到3个尺寸模板;
接着,根据模板,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。