【技术实现步骤摘要】
一种辅助驾驶的视觉感知方法及系统
[0001]本申请涉及辅助驾驶
,尤其是涉及一种辅助驾驶的视觉感知方法及系统。
技术介绍
[0002]随着深度学习技术的大力发展,辅助驾驶领域成为其主要落地场景,而视觉感知是辅助驾驶系统的重要模块,包括车道线检测、可行驶区域分割和目标检测等具有挑战性的任务。传统的深度学习算法通常只解决以上任务中的一项,无法满足辅助驾驶过程中同时感知多种环境因素的需求。目前较为先进的算法往往通过多任务学习来提高感知效率,现有的多任务辅助驾驶视觉感知系统,通常在深度学习模型的训练阶段进行改进,主要分为结构、优化方法和任务关系三个角度的学习。其中:
[0003](1)辅助驾驶视觉感知的多任务模型首先聚焦于对网络结构的设计,均有效提升了在单任务上的性能。例如,在Faster RCNN基础上增加FCN分支来产生对应类别的mask,从而准确地完成语义分割任务。或者,使用编码器
‑
解码器结构,设计一个共享编码器和三个任务解码器的多任务模型,用于分类、目标检测和语义分割。或者,使用轻量级CNN作为编码器来提取图像特征,然后将特征图输入到各个解码器中完成视觉感知任务,在准确率和速度方面均达到了最优性能。
[0004](2)多任务模型的优化方法主要体现为对损失函数和对梯度的优化,前者都是针对不同任务进行加权和,关键的是如何加权。目前有利用任务不确定性、学习速率、模型性能、回报幅度以及几何平均等方法。后者围绕梯度进行调优,主要是对梯度的修正来平衡任务间的训练速率,如GradNorm ...
【技术保护点】
【技术特征摘要】
1.一种辅助驾驶的视觉感知方法,其特征在于,包括如下步骤:S100:收集辅助驾驶图像数据,将数据集预处理后构成输入X;S200:构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f
i
(X);S300:计算多任务神经网络模型F最终的损失函数L
all
;S400:将最小化作为损失函数L
all
的目标进行优化,最终得到最佳多任务神经网络模型F
*
。2.如权利要求1所述的辅助驾驶的视觉感知方法,其特征在于:多任务神经网络模型F包括参数共享层B和任务层T;则步骤S200包括如下过程:S210:将输入X代入参数共享层B;S220:参数共享层B提取出输入X的图像特征并得到特征图M;S230:将特征图M代入任务层T中,得到多个分支任务特定的输出f
i
(X)。3.如权利要求2所述的辅助驾驶的视觉感知方法,其特征在于:任务层T的初始结构参数确定过程如下:首先对任务层T的各个分支结构进行初始化以得到每一层分支结构的参数为α
i
;随后通过随机组合得到每一层分支结构的参数为α
i0
;则在步骤S230中输出f
i
(X)可表示为f
i
(X,w(α));其中,α为分支结构参数,w为神经网络权重,w的尺寸由α通过迭代得到,且第一次迭代时α的取值为α
i0
。4.如权利要求3所述的辅助驾驶的视觉感知方法,其特征在于:在步骤S300中,多任务神经网络模型F的输出损失为L
out
,多任务神经网络模型F的结构损失为L
arch
;则损失函数L
all
=L
out
+L
arch
。5.如权利要求4所述的辅助驾驶的视觉感知方法,其特征在于:各分支任务的输出损失为L
i
,则多任务神经网络模型F的输出损失L
out
由N个分支任务的输出损失L
i
...
【专利技术属性】
技术研发人员:李科,
申请(专利权)人:宁波弗浪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。