一种3D多数据集联合训练方法、电子设备及存储介质技术

技术编号：37856352 阅读：15 留言：0更新日期：2023-06-14 22:50

本申请提供一种3D多数据集联合训练方法，该方法包括：获取若干3D数据集；利用若干3D数据集联合训练3D目标检测模型，其中3D目标检测模型包括数据级校正操作和语义级耦合

全部详细技术资料下载

【技术实现步骤摘要】
一种3D多数据集联合训练方法、电子设备及存储介质

[0001]本专利技术属于目标检测
，特别涉及一种3D多数据集联合训练方法、电子设备及存储介质。

技术介绍

[0002]3D目标检测技术是自动驾驶领域中发挥非常关键的作用，能够帮助车辆感知周围的环境。同时，基于LiDAR(激光雷达)的3D目标检测技术旨在使用LiDAR传感器来识别和定位给定场景中的实例对象。得益于大规模带标注的3D LiDAR数据集的快速发展，该技术最近取得了巨大进展。不幸的是，目前主流的3D目标检测模型都是遵循经典的单数据集训练
‑
测试范式来设计的，这会导致这些检测模型难以直接部署到具有不同数据分布的另一个数据集中。例如，当基线检测模型在Waymo上进行训练并且另一个不同的数据集如nuScenes上进行评估时，检测模型的检测精度会发生严重的退化(从74.60％降至17.31％)。因此，这种单一数据集训练
‑
测试范式无法在不同的数据集上表现良好，进一步损害了当前3D感知模型的数据集级别的泛化能力。
[0003]为了减少不同3D数据集之间的差异，一些研究人员试图利用无监督域适配(Unsupervised Domain Adaptation，UDA)技术，该技术旨在将预训练的源域检测器迁移到新的领域(或数据集)。尽管这些基于UDA的3D目标检测工作在新的目标域上实现了良好的检测精度增益，但它们仍然是从源域到目标域的单向模型迁移过程，而不是双向的多数据集泛化过程。而多数据集泛化是未来实现自动驾驶感知能力提升的...

【技术保护点】

【技术特征摘要】
1.一种3D多数据集联合训练方法，其特征在于，所述方法包括：获取若干3D数据集；利用所述若干3D数据集联合训练3D目标检测模型，其中所述3D目标检测模型包括数据级校正操作和语义级耦合
‑
重新组合模块，所述数据级校正操作用于对齐所述若干3D数据集的点云数据分布差异，所述语义级耦合
‑
重新组合模块用于挖掘来自不同3D数据集的可重用的特征表达。2.根据权利要求1所述的方法，其特征在于，所述数据级校正操作包括：采用数据集具体的均值方差分布，正则每一个神经网络层的特征表达：其中，表示第t个数据集的第j个网络层的特征表达，ξ是为了保证数值计算稳定；表示第t个数据集第j个网络层的均值，表示第t个数据集第j个网络层的方差；表示第t个数据集的第j个网络层的点云数据；一种参数可学习的变换过程被用来恢复模型特征的表达能力，具体计算方式如下：其中，表示第t个数据集的第j个网络层的输出特征，γ
j
和β
j
均表示第j个网络层的可学习参数。3.根据权利要求2所述的方法，其特征在于，所述语义级耦合
‑
重新组合模块用于：将所述若干数据集的输出特征耦合，并学习数据集间可迁移的特征表达，得到数据集共享的特征表达；根据所述数据集共享的特征表达进行数据集内部的特征重新组合操作，恢复数据集的鸟瞰场景的特征表达。4.根据权利要求3所述的方法，其特征在于，所述将所述若干数据集的输出特征耦合，并学习数据集间可迁移的特征表达，得到数据集共享的特征表达，包括：将所述若干数据集的输出特征拼接为统一的特征表达，并学习数据集共享的鸟瞰场景特征的特征表达，得到数据集共享的特征表达。5.根据权利要求4所述的方法，其特征在于，所...

【专利技术属性】
技术研发人员：李怡康，张铂，石博天，闫翔超，袁家康，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人