汽车可行驶区域识别方法技术

技术编号:39397232 阅读:8 留言:0更新日期:2023-11-19 15:51
本发明专利技术涉及汽车技术领域,提供了汽车可行驶区域识别方法

【技术实现步骤摘要】
汽车可行驶区域识别方法、深度学习模型构建方法和装置


[0001]本专利技术涉及汽车
,特别是涉及汽车可行驶区域识别方法

深度学习模型构建方法和装置


技术介绍

[0002]汽车可行驶区域分割是指对一张汽车驾驶场景图像进行分割,将图像中的每个像素归属到不同的类别中,从而实现对汽车可行驶区域的识别和分割,传统图像处理手段如边缘检测和光流法在可行驶区域检测中存在适应性有限

缺乏语义信息

参数敏感以及计算效率较低等一些缺点,且现有技术往往针对单摄像头视角的图像进行可行驶区域的识别,导致识别区域的视角受限,导致汽车可行驶区域的识别不够精准

[0003]在现有技术中,还通常使用一些语义分割模型进行可识别区域的分割,但这些语义分割模型的体积通常较大,将其应用到汽车可行驶区域识别方法中时,会占用更多的计算资源,不适用于在一些计算资源有限的设备上运行

[0004]鉴于此,克服该现有技术所存在的缺陷是本
亟待解决的问题


技术实现思路

[0005]本专利技术要解决的技术问题是现有技术中的汽车可行驶区域识别占用计算资源通常较多,不适用于在一些计算资源有限的设备上运行

[0006]本专利技术采用如下技术方案:
[0007]第一方面,本专利技术提供了一种汽车可行驶区域识别方法,包括:
[0008]使用
Segformer
模型进行汽车可行驶区域的识别

[0009]优选的,所述使用
Segformer
模型进行汽车可行驶区域的识别,具体包括:
[0010]对汽车行驶周边的多张环境样本图像进行拼接,得到以车身为中心的鸟瞰图;
[0011]对鸟瞰图进行预处理后,输入至训练完成的
Segformer
模型进行汽车可行驶区域的识别,以识别出可行驶区域

[0012]第二方面,本专利技术还提供了一种用于汽车可行驶区域识别的深度学习模型构建方法,所述深度学习模型为
Segformer
模型,构建方法包括:
[0013]对多张鸟瞰图进行标记,生成训练数据集

验证数据集和测试数据集;
[0014]构建初始
Segformer
模型;
[0015]使用所述训练数据集

验证数据集和测试数据集对初始
Segformer
模型进行训练,得到用于汽车可行驶区域识别的训练完成的
Segformer
模型

[0016]优选的,所述初始
Segformer
模型为尺寸居中的
MiT

B2
模型;
[0017]所述
MiT

B2
模型包括四个编码器

一个解码器和一个输出层;
[0018]每个编码器包括多个编码层,在每两个编码层之间还设置有重叠压缩合并层;
[0019]所述解码器包括多个解码层和一个上采样层,所述解码层用于使用自注意力机制和跨注意力机制整合不同层级的特征信息,所述上采样层用于将特征图的尺寸增加到与输
入图像的尺寸相同;
[0020]所述输出层包括一个分类头,所述分类头为由一个线性层函数实现的卷积层,用于将各像素分配至不同的类别

[0021]优选的,所述使用所述训练数据集

验证数据集和测试数据集对初始
Segformer
模型进行训练,包括:
[0022]将所述训练数据集划分为多个批次的训练子集,将验证数据集划分为多个批次的验证子集,将测试数据集划分为多个测试子集;
[0023]将每一批次的训练子集和每一批次的验证子集输入至相应批次的第一中间模型中进行训练,以得到相应批次的第二中间模型;其中,以初始
Segformer
模型作为第一批次的第一中间模型,以上一批次的第二中间模型作为下一批次的第一中间模型;
[0024]使用相应批次的测试子集对相应批次的第二中间模型进行测试,得到相应批次的测试结果,根据所有批次的测试结果从所有批次的第二中间模型中选择一个第二中间模型作为训练完成的
Segformer
模型

[0025]优选的,所述方法还包括:
[0026]在训练得到预设数量个第二中间模型后,在后续各第一中间模型的各编码器中添加噪声;
[0027]根据所添加噪声的水平,设定相应的学习率,以便于根据添加有噪声的第一中间模型和相应的学习率进行后续批次的训练

[0028]优选的,所述测试结果为各类别的准确率,所述使用相应批次的测试子集对相应批次的第二中间模型进行测试,得到相应批次的测试结果,具体包括:对每一批次的第二中间模型执行以下操作:
[0029]将相应批次的测试子集输入至相应批次的第二中间模型,输出预测结果;其中,所述预测结果包括测试子集中每张图像的每个像素的预测类别;
[0030]将每个像素的预测类别与标记所得的每个像素的标记类别进行匹配,判断各像素的预测类别是否正确,统计相应批次的第二中间模型在各类别的准确率

[0031]优选的,所述根据所有批次的测试结果从所有批次的第二中间模型中选择一个第二中间模型作为训练完成的
Segformer
模型,具体包括:
[0032]从所有类别的准确率均大于相应预设准确率的第二中间模型中,选择整体准确率最高的第二中间模型作为训练完成的
Segformer
模型;其中,所述相应第二中间模型的整体准确率由该第二中间模型的各类别的准确率结合预设规则计算得到

[0033]优选的,在使用所述训练数据集

验证数据集和测试数据集对初始
Segformer
模型进行训练前,所述方法还包括对训练数据集

验证数据集和测试数据集中的图像进行数据增广,具体包括:
[0034]将训练数据集和验证数据集中的图像进行缩放,使缩放后图像的长度和宽度分别为2×
m1
×
k

m2
×
k
;其中,
m1
为图像的长度,
m2
为图像的宽度,
k
为预设缩放系数;
[0035]对缩放后的图像进行裁剪,使裁剪后图像恢复缩放前的图像大小,并对图像进行翻转;其中,对缩放后的图像进行裁剪的比例不超出预设裁剪比例;
[0036]还对图像的亮度

对比度

饱和度和色调进行调整,和对图像进行色彩空间转换

[0037]第三方面,本专利技术还提供了一种用于汽车可行驶本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种汽车可行驶区域识别方法,其特征在于,包括:使用
Segformer
模型进行汽车可行驶区域的识别
。2.
根据权利要求1所述的汽车可行驶区域识别方法,其特征在于,所述使用
Segformer
模型进行汽车可行驶区域的识别,具体包括:对汽车行驶周边的多张环境样本图像进行拼接,得到以车身为中心的鸟瞰图;对鸟瞰图进行预处理后,输入至训练完成的
Segformer
模型进行汽车可行驶区域的识别,以识别出可行驶区域
。3.
一种用于汽车可行驶区域识别的深度学习模型构建方法,其特征在于,所述深度学习模型为
Segformer
模型,构建方法包括:对多张鸟瞰图进行标记,生成训练数据集

验证数据集和测试数据集;构建初始
Segformer
模型;使用所述训练数据集

验证数据集和测试数据集对初始
Segformer
模型进行训练,得到用于汽车可行驶区域识别的训练完成的
Segformer
模型
。4.
根据权利要求3所述的用于汽车可行驶区域识别的深度学习模型构建方法,其特征在于,所述初始
Segformer
模型为尺寸居中的
MiT

B2
模型;所述
MiT

B2
模型包括四个编码器

一个解码器和一个输出层;每个编码器包括多个编码层,在每两个编码层之间还设置有重叠压缩合并层;所述解码器包括多个解码层和一个上采样层,所述解码层用于使用自注意力机制和跨注意力机制整合不同层级的特征信息,所述上采样层用于将特征图的尺寸增加到与输入图像的尺寸相同;所述输出层包括一个分类头,所述分类头为由一个线性层函数实现的卷积层,用于将各像素分配至不同的类别
。5.
根据权利要求4所述的用于汽车可行驶区域识别的深度学习模型构建方法,其特征在于,所述使用所述训练数据集

验证数据集和测试数据集对初始
Segformer
模型进行训练,包括:将所述训练数据集划分为多个批次的训练子集,将验证数据集划分为多个批次的验证子集,将测试数据集划分为多个测试子集;将每一批次的训练子集和每一批次的验证子集输入至相应批次的第一中间模型中进行训练,以得到相应批次的第二中间模型;其中,以初始
Segformer
模型作为第一批次的第一中间模型,以上一批次的第二中间模型作为下一批次的第一中间模型;使用相应批次的测试子集对相应批次的第二中间模型进行测试,得到相应批次的测试结果,根据所有批次的测试结果从所有批次的第二中间模型中选择一个第二中间模型作为训练完成的
Segformer
模型
。6.
根...

【专利技术属性】
技术研发人员:龙柄全刘文许定超
申请(专利权)人:上海保隆汽车科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1