一种辅助驾驶的视觉感知方法及系统技术方案

技术编号:37596490 阅读:10 留言:0更新日期:2023-05-18 11:43
本申请公开了一种辅助驾驶的视觉感知方法,包括如下步骤:S100:收集辅助驾驶图像数据,将数据集预处理后构成输入X;S200:构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f

【技术实现步骤摘要】
一种辅助驾驶的视觉感知方法及系统


[0001]本申请涉及辅助驾驶
,尤其是涉及一种辅助驾驶的视觉感知方法及系统。

技术介绍

[0002]随着深度学习技术的大力发展,辅助驾驶领域成为其主要落地场景,而视觉感知是辅助驾驶系统的重要模块,包括车道线检测、可行驶区域分割和目标检测等具有挑战性的任务。传统的深度学习算法通常只解决以上任务中的一项,无法满足辅助驾驶过程中同时感知多种环境因素的需求。目前较为先进的算法往往通过多任务学习来提高感知效率,现有的多任务辅助驾驶视觉感知系统,通常在深度学习模型的训练阶段进行改进,主要分为结构、优化方法和任务关系三个角度的学习。其中:
[0003](1)辅助驾驶视觉感知的多任务模型首先聚焦于对网络结构的设计,均有效提升了在单任务上的性能。例如,在Faster RCNN基础上增加FCN分支来产生对应类别的mask,从而准确地完成语义分割任务。或者,使用编码器

解码器结构,设计一个共享编码器和三个任务解码器的多任务模型,用于分类、目标检测和语义分割。或者,使用轻量级CNN作为编码器来提取图像特征,然后将特征图输入到各个解码器中完成视觉感知任务,在准确率和速度方面均达到了最优性能。
[0004](2)多任务模型的优化方法主要体现为对损失函数和对梯度的优化,前者都是针对不同任务进行加权和,关键的是如何加权。目前有利用任务不确定性、学习速率、模型性能、回报幅度以及几何平均等方法。后者围绕梯度进行调优,主要是对梯度的修正来平衡任务间的训练速率,如GradNorm方法等。
[0005](3)在任务关系上也需要额外的关注,相关性较弱的任务可能会带来负面迁移效应。因此需要让模型学习确定的任务表示或者任务间的关联,例如根据相似性进行聚类,并利用学到的特征表示来进一步提高性能。
[0006]以上的方法及系统虽然取得了一定的成效,但仍然存在以下两个问题:
[0007](1)对于特定场景或特定任务还需要专家经验进行任务权重或梯度系数的调整。
[0008](2)需要耗费大量时间手工实验来确定系统中模型结构参数。

技术实现思路

[0009]本申请的其中一个目的在于提供一种能够解决上述
技术介绍
中至少一个问题的辅助驾驶的视觉感知方法及系统。
[0010]为达到上述的目的,本申请采用的技术方案为:一种辅助驾驶的视觉感知方法,包括如下步骤:
[0011]S100:收集辅助驾驶图像数据,将数据集预处理后构成输入X;
[0012]S200:构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f
i
(X);
[0013]S300:计算多任务神经网络模型F最终的损失函数L
all

[0014]S400:将最小化作为损失函数L
all
的目标进行优化,最终得到最佳多任务神经网络模型F
*

[0015]优选的,多任务神经网络模型F包括参数共享层B和任务层T;则步骤S200包括如下过程:
[0016]S210:将输入X代入参数共享层B;
[0017]S220:参数共享层B提取出输入X的图像特征并得到特征图M;
[0018]S230:将特征图M代入任务层T中,得到多个分支任务特定的输出f
i
(X)。
[0019]优选的,任务层T的初始结构参数确定过程如下:首先对任务层T的各个分支结构进行初始化以得到每一层分支结构的参数为α
i
;随后通过随机组合得到每一层分支结构的参数为α
i0
;则在步骤S230中输出f
i
(X)可表示为f
i
(X,w(α));其中,α为分支结构参数,w为神经网络权重,w的尺寸由α通过迭代得到,且第一次迭代时α的取值为α
i0

[0020]优选的,在步骤S300中,多任务神经网络模型F的输出损失为L
out
,多任务神经网络模型F的结构损失为L
arch
;则损失函数L
all
=L
out
+L
arch

[0021]优选的,各分支任务的输出损失为L
i
,则多任务神经网络模型F的输出损失L
out
由各个分支任务的输出损失L
i
进行加权,结构损失L
arch
为各个分支任务之间损失差距的累加和;即
[0022][0023][0024]其中,α为分支结构参数,w为神经网络权重,N为分支任务数量。
[0025]优选的,步骤S400包括如下具体过程:
[0026]S410:对任务层T进行结构搜索,以得到在多个任务间保持平衡的分支任务网络结构参数以及最优的神经网络权重参数;
[0027]S420:将最小化损失函数作为优化目标,并通过算法对步骤S410中的参数进行训练;
[0028]S430:将训练的参数与多任务神经网络模型F进行拟合,以得到自动化搜索确定的最佳多任务神经网络模型F
*

[0029]优选的,在步骤S410中,对于任务层T的结构搜索,需要将任务层T的分支结构由离散结构转变为连续化搜索空间;转变后的连续化搜索空间通过如下公式进行表示:
[0030][0031]其中,节点X为隐表示,函数o(
·
)为节点与节点之间候选的操作,O表示候选操作的集合,是节点(i,j)之间结构候选操作o的权重。
[0032]优选的,在步骤S420中,通过对输出损失L
out
和结构损失L
arch
进行双优化来实现对损失函数L
all
的优化;具体通过梯度下降法来最小化以下目标:
[0033][0034][0035]优选的,通过迭代优化算法对目标进行求解,得到最佳的分支结构参数α和网络权重w;通过将连续的结构参数α恢复为离散的网络节点连接操作o,进而得到一个任务分支结构确定且神经网络权重表现最佳的多任务神经网络模型F
*
;其中,对连续表示的神经网络结构进行离散化计算的公式如下:
[0036][0037][0038]一种辅助驾驶的视觉感知系统,包括数据输入模块、共享层特征提取模块、任务层结构搜索模块和模型输出模块;所述数据输入模块用于接收多个数据集的图像并进行预处理;所述共享层特征提取模块用于提取图像的低层语义特征;所述任务层结构搜索模块用于对各任务的网络结构参数进行自动化搜索;所述模型输出模块用于输出最佳模型。
[0039]与现有技术相比,本申请的有益效果在于:
[0040](1)本申请针对辅助驾驶感知复杂环境的实时性需求,构建包含车道线分割和障碍物检测等问题的多任务模型,有效降低网络参数量和计算量,同时减少线上推理时间,非常有利于实际应用。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种辅助驾驶的视觉感知方法,其特征在于,包括如下步骤:S100:收集辅助驾驶图像数据,将数据集预处理后构成输入X;S200:构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f
i
(X);S300:计算多任务神经网络模型F最终的损失函数L
all
;S400:将最小化作为损失函数L
all
的目标进行优化,最终得到最佳多任务神经网络模型F
*
。2.如权利要求1所述的辅助驾驶的视觉感知方法,其特征在于:多任务神经网络模型F包括参数共享层B和任务层T;则步骤S200包括如下过程:S210:将输入X代入参数共享层B;S220:参数共享层B提取出输入X的图像特征并得到特征图M;S230:将特征图M代入任务层T中,得到多个分支任务特定的输出f
i
(X)。3.如权利要求2所述的辅助驾驶的视觉感知方法,其特征在于:任务层T的初始结构参数确定过程如下:首先对任务层T的各个分支结构进行初始化以得到每一层分支结构的参数为α
i
;随后通过随机组合得到每一层分支结构的参数为α
i0
;则在步骤S230中输出f
i
(X)可表示为f
i
(X,w(α));其中,α为分支结构参数,w为神经网络权重,w的尺寸由α通过迭代得到,且第一次迭代时α的取值为α
i0
。4.如权利要求3所述的辅助驾驶的视觉感知方法,其特征在于:在步骤S300中,多任务神经网络模型F的输出损失为L
out
,多任务神经网络模型F的结构损失为L
arch
;则损失函数L
all
=L
out
+L
arch
。5.如权利要求4所述的辅助驾驶的视觉感知方法,其特征在于:各分支任务的输出损失为L
i
,则多任务神经网络模型F的输出损失L
out
由N个分支任务的输出损失L
i
...

【专利技术属性】
技术研发人员:李科
申请(专利权)人:宁波弗浪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1