一种辅助驾驶的视觉感知方法及系统技术方案

技术编号：37596490 阅读：10 留言：0更新日期：2023-05-18 11:43

本申请公开了一种辅助驾驶的视觉感知方法，包括如下步骤：S100：收集辅助驾驶图像数据，将数据集预处理后构成输入X；S200：构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f

全部详细技术资料下载

【技术实现步骤摘要】
一种辅助驾驶的视觉感知方法及系统

[0001]本申请涉及辅助驾驶
，尤其是涉及一种辅助驾驶的视觉感知方法及系统。

技术介绍

[0002]随着深度学习技术的大力发展，辅助驾驶领域成为其主要落地场景，而视觉感知是辅助驾驶系统的重要模块，包括车道线检测、可行驶区域分割和目标检测等具有挑战性的任务。传统的深度学习算法通常只解决以上任务中的一项,无法满足辅助驾驶过程中同时感知多种环境因素的需求。目前较为先进的算法往往通过多任务学习来提高感知效率，现有的多任务辅助驾驶视觉感知系统，通常在深度学习模型的训练阶段进行改进，主要分为结构、优化方法和任务关系三个角度的学习。其中：
[0003](1)辅助驾驶视觉感知的多任务模型首先聚焦于对网络结构的设计，均有效提升了在单任务上的性能。例如，在Faster RCNN基础上增加FCN分支来产生对应类别的mask，从而准确地完成语义分割任务。或者，使用编码器
‑
解码器结构，设计一个共享编码器和三个任务解码器的多任务模型，用于分类、目标检测和语义分割。或者，使用轻量级CNN作为编码器来提取图像特征，然后将特征图输入到各个解码器中完成视觉感知任务，在准确率和速度方面均达到了最优性能。
[0004](2)多任务模型的优化方法主要体现为对损失函数和对梯度的优化，前者都是针对不同任务进行加权和，关键的是如何加权。目前有利用任务不确定性、学习速率、模型性能、回报幅度以及几何平均等方法。后者围绕梯度进行调优，主要是对梯度的修正来平衡任务间的训练速率，如GradNorm...

【技术保护点】

【技术特征摘要】
1.一种辅助驾驶的视觉感知方法，其特征在于，包括如下步骤：S100：收集辅助驾驶图像数据，将数据集预处理后构成输入X；S200：构建多任务神经网络模型F并将输入X代入以得到多个分支任务特定的输出f
i
(X)；S300：计算多任务神经网络模型F最终的损失函数L
all
；S400：将最小化作为损失函数L
all
的目标进行优化，最终得到最佳多任务神经网络模型F
*
。2.如权利要求1所述的辅助驾驶的视觉感知方法，其特征在于：多任务神经网络模型F包括参数共享层B和任务层T；则步骤S200包括如下过程：S210：将输入X代入参数共享层B；S220：参数共享层B提取出输入X的图像特征并得到特征图M；S230：将特征图M代入任务层T中，得到多个分支任务特定的输出f
i
(X)。3.如权利要求2所述的辅助驾驶的视觉感知方法，其特征在于：任务层T的初始结构参数确定过程如下：首先对任务层T的各个分支结构进行初始化以得到每一层分支结构的参数为α
i
；随后通过随机组合得到每一层分支结构的参数为α
i0
；则在步骤S230中输出f
i
(X)可表示为f
i
(X,w(α))；其中，α为分支结构参数，w为神经网络权重，w的尺寸由α通过迭代得到，且第一次迭代时α的取值为α
i0
。4.如权利要求3所述的辅助驾驶的视觉感知方法，其特征在于：在步骤S300中，多任务神经网络模型F的输出损失为L
out
，多任务神经网络模型F的结构损失为L
arch
；则损失函数L
all
＝L
out
+L
arch
。5.如权利要求4所述的辅助驾驶的视觉感知方法，其特征在于：各分支任务的输出损失为L
i
，则多任务神经网络模型F的输出损失L
out
由N个分支任务的输出损失L
i
...

【专利技术属性】
技术研发人员：李科，
申请(专利权)人：宁波弗浪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人