一种基于知识蒸馏的BEV语义分割模型训练方法、系统、设备和介质技术方案

技术编号：36550524 阅读：37 留言：0更新日期：2023-02-04 17:03

本发明专利技术属于自动驾驶领域，具体涉及一种基于知识蒸馏的BEV语义分割模型训练方法，包括：获取图像数据集；将所述图像数据集输入至学生模型中进行特征提取，得到第一平面视图数据集；将所述图像数据集输入至老师模型中进行特征提取，得到第二平面视图数据集；根据所述图像数据集中图像数据的空间坐标对所述第一平面视图数据集和第二平面视图数据集进行转换，得到第一BEV视图数据集和第二BEV视图数据集；对所述第一BEV视图数据集和第二BEV视图数据集进行特征提取并预测概率输出，得到第一概率分布集和第二概率分布集；根据所述第一概率分布集和第二概率分布集对学生模型进行优化，并将优化后的学生模型作为目标语义分割模型。将优化后的学生模型作为目标语义分割模型。将优化后的学生模型作为目标语义分割模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识蒸馏的BEV语义分割模型训练方法、系统、设备和介质

[0001]本专利技术属于自动驾驶领域，具体涉及一种基于知识蒸馏的BEV语义分割模型训练方法、系统、设备和介质。

技术介绍

[0002]随着车载摄像头在现代车辆装备中的广泛普及，基于车载视觉传感器实现对车辆行驶过程中遭遇的各类目标检测识别已经日趋成熟，其作用无论对当前辅助驾驶还是未来自动驾驶均彰显出重要价值，成为现代汽车高端智能化不可或缺的核心技术。多摄融合是融合车载多视角相机图像，以车辆坐标系为中心布局的从上向下构建俯视视角的鸟瞰图(BEV,Bird Eye View)，范围涵盖车辆周围幅宽数十至上百米区域，作用是通过视角转换来方便驾驶员以鸟瞰视角获取车周环境，进而提升对车辆的操控能力。
[0003]BEV感知技术是近年、尤其是2020年开始得到学界广泛关注并开启快速发展的，多数BEV感知算法模型在面向多摄数据处理时，所需的网络结构复杂、训练标注过程繁琐、时效性偏低、计算存储开销大，因此截至目前尚未形成具备充分影响力并满足车端实时应用的主流计算框架，其模型结构仍在高速迭代并不断颠覆中，距离其成熟应用仍存轻量化、高性能、高效率等诸多难题正待解决。
[0004]现有技术包括基于激光雷达点云数据，提取每个体素的特征，能够加速点云网络语义分割。但该方法可代替性高，已有多种网络可用于代替简化的PointNet用于加速。同时摄像头相对于激光雷达应用更广、经济型高、稳定性高；基于多摄融合的鸟瞰图语义分割应用价值更高。

技术实现思路

[...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的BEV语义分割模型训练方法，其特征在于，包括：获取图像数据集；将所述图像数据集输入至学生模型中进行特征提取，得到第一平面视图数据集；将所述图像数据集输入至老师模型中进行特征提取，得到第二平面视图数据集；根据所述图像数据集中图像数据的空间坐标对所述第一平面视图数据集和第二平面视图数据集进行转换，得到第一BEV视图数据集和第二BEV视图数据集；对所述第一BEV视图数据集和第二BEV视图数据集进行特征提取并预测概率输出，得到第一概率分布集和第二概率分布集；根据所述第一概率分布集和第二概率分布集对学生模型进行优化，并将优化后的学生模型作为目标语义分割模型。2.根据权利要求1所述的BEV语义分割模型训练方法，其特征在于，所述学生模型采用Resnet18神经网络模型；所述老师模型采用Resnet101神经网络模型。3.根据权利要求1所述的BEV语义分割模型训练方法，其特征在于，所述对所述第一BEV视图数据集和第二BEV视图数据集进行特征提取并预测概率输出，得到第一概率分布集和第二概率分布集的步骤包括：将所述第一BEV视图数据集输入至BEV特征提取网络中进行特征提取，得到第一特征视图数据集；将所述第二BEV视图数据集输入至BEV特征提取网络中进行特征提取，得到第二特征视图数据集；通过卷积神经网络的卷积层对所述第一特征视图数据集和第二特征视图数据集进行分类，得到对应的所述第一概率分布集和第二概率分布集。4.根据权利要求3所述的BEV语义分割模型训练方法，其特征在于，所述BEV特征提取网络采用Resnet18神经网络模型。5.根据权利要求1所述的BEV语义分割模型训练方法，其特征在于，所述根据所述第一概率分布集和第二概率分布集对学生模型进行优化，并将优化后的学生模型作为目标语义分割模型的步骤包括：通过损失函数计算所述第一概率分布集和第二概率分布集的差异值；计算所述差异值的反向梯度值，并优化所述训练后的学...

【专利技术属性】
技术研发人员：漆昇翔，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人