一种基于半监督transformer检测的自动驾驶场景挖掘方法技术

技术编号：33350062 阅读：20 留言：0更新日期：2022-05-08 09:53

本发明专利技术提供了一种基于半监督transformer检测的自动驾驶场景挖掘方法，包括：采用已有数据集作为标注数据，设置标注数据的超参数，分别训练2个检测模型；采用已有数据集训练小模型；对相机采集到的未标注数据，通过设置合理的参数获得检测结果；对2个检测模型的检测结果进行取交集得到未标注数据的真值，作为伪标注数据；对伪标注数据进行数据增强处理，扩充伪标注数据集；将标注数据和伪标注数据集作为总数据，并设置伪标注数据的loss权重，重新训练student检测模型；使用小模型和student检测模型在已有的未标注数据和新采集的未标注数据中进行推理检测，挖掘需要的长尾场景数据；对长尾场景数据进行筛选，作为待标注数据，扩充长尾数据场景库。扩充长尾数据场景库。扩充长尾数据场景库。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于半监督transformer检测的自动驾驶场景挖掘方法

[0001]本专利技术涉及自动驾驶
，更具体的说是，涉及一种基于半监督transformer检测的自动驾驶场景挖掘方法。

技术介绍

[0002]在自动驾驶场景中，深度学习感知模型需要检测的目标种类众多，为了达到较好的检测精度，在全监督学习框架下，不仅需要合理地构建算法模型，还需要极其庞大的数据集。目前在常规开源数据集中，由于是自然采集，货车公交车等目标的分布数量相比于小轿车行人显得较为稀少，阴雨天气等也较为少见，即数据集中存在着数据不平衡的问题，一般称之为长尾问题。
[0003]长尾问题会导致目标检测模型对于这些场景的检测效果不佳，需要在新采集的数据中，挖掘出长尾数据，进而标注扩充已有数据集，确保数据分布较为平衡。
[0004]大量有标注的数据获取成本非常高，但是我们却可以非常容易地获取海量的无标注数据，在海量数据中挖掘长尾场景目前一般依赖着人工筛查，由于数据极其庞大，可达到T级规模，在大数据背景下，人工筛查的成本显著增大。如何快速有效地在...

【技术保护点】

【技术特征摘要】
1.一种基于半监督transformer检测的自动驾驶场景挖掘方法，其特征在于，包括：采用已有数据集作为标注数据，设置标注数据的超参数，分别训练2个检测模型；采用已有数据集训练小模型；对相机采集到的未标注数据，通过设置合理的参数获得检测结果；对2个检测模型的检测结果进行取交集得到未标注数据的真值，作为伪标注数据；对伪标注数据进行数据增强处理，扩充伪标注数据集；将标注数据和伪标注数据集作为总数据，并设置伪标注数据的loss权重，重新训练以swin transformer为backbone的yolov5检测模型，称之为student模型；使用小模型和st...

【专利技术属性】
技术研发人员：李金涛，桂瀚洋，董健，刘飞龙，
申请(专利权)人：上海宏景智驾信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人