一种面向自动驾驶的图像半自动标注模型训练方法技术

技术编号:33528089 阅读:12 留言:0更新日期:2022-05-19 01:53
本发明专利技术公开了一种面向自动驾驶的图像半自动标注模型训练方法,所述模型训练方法包括,将未标注样本集随机切分生成n份候选未标注样本集,将首个候选未标注样本集和预训练模型集送入系统模块,经系统模块训练后生成训练后的模型,然后依次将上一次训练后的模型和下一个候选未标注样本集一起送入系统模块进行模型的迭代训练,如此往复遍历所有候选未标注样本集。本发明专利技术通过系统模块继续训练,可以剔除大量易区分样本的标注,充分利用难区分样本,得到迭代过程中模型精度的变化值,最终可以满足预设的精度要求,有效提升了训练模型的性能。性能。性能。

【技术实现步骤摘要】
一种面向自动驾驶的图像半自动标注模型训练方法


[0001]本专利技术涉及自动驾驶视觉检测
,具体为一种面向自动驾驶的图像半自动标注模型训练方法。

技术介绍

[0002]当前人工智能蓬勃发展,得到好的数据进行模型训练和评估显得越来越重要,尤其是在自动驾驶领域中的视觉检测方面,面临大量的图像数据标注问题,现有技术中的图像数据标注方法耗费了大量的人力物力,并且在训练模型的性能和精度上也没有得到很好的提升。基于此,如何设计一种架构可以大大减少人工数据标注的工作量,同时还能提升预训练模型的性能和精度是自动驾驶领域视觉检测领域亟需解决的问题。

技术实现思路

[0003]本专利技术的目的在于提供了一种面向自动驾驶的图像半自动标注模型训练方法,通过建立利用难区分样本进行迭代的模型训练方法,减少了人工数据标注的工作量的同时大大提升了训练模型的性能。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种面向自动驾驶的图像半自动标注模型训练方法,所述模型训练方法包括,将未标注样本集随机切分生成n份候选未标注样本集,将首个候选未标注样本集和预训练模型集送入系统模块,经系统模块训练后生成训练后的模型,然后依次将上一次训练后的模型和下一个候选未标注样本集一起送入系统模块进行模型的迭代训练,如此往复遍历所有候选未标注样本集。
[0005]优选的,所述预训练模型包括特征提取子模型和分类/回归子模型,所述系统模块的训练过程包括分别对所述特征提取子模型和分类/回归子模型进行推理生成相应的推理结果,然后根据推理结果进行人工标注,根据人工标注后的信息进行模型再训练生成训练后的模型。
[0006]优选的,所述推理结果包括所述特征提取子模型和所述分类/回归子模型针对首个候选未标注样本集相对应的易区分样本和难区分样本;
[0007]所述系统模块的训练过程针对难区分样本进行人工标注。
[0008]优选的,依据平均置信度对易区分样本和难区分样本进行划分,将平均置信度大于0.5的样本划分为易区分样本,将平均置信度小于等于0.5的样本划分为难区分样本。
[0009]优选的,所述系统模块的训练过程还包括对训练后的模型进行模型性能评估,所述模型性能评估参数包括评估精度。
[0010]优选的,所述系统模块的训练过程起始包括将每份候选未标注样本集切分成测试集合和训练集合,所述特征提取子模型和分类/回归子模型对训练集合进行推理;
[0011]所述模型性能评估还包括依据训练后的模型对测试集合进行性能测试,生成训练后的模型的评估精度。
[0012]优选的,所述模型性能评估中面向于分类模型的计算方式是F1Measure,面向于回
归模型的计算方式是IOU或Map。
[0013]优选的,所述系统模块的训练过程还包括将每份候选未标注样本集进行模型推理后所得到的难区分样本进行合并重新生成未标注样本集等待下一次迭代,直至最后一次计算的评估精度值满足模型精度要求。
[0014]优选的,所述系统模块的训练过程还包括将每份候选未标注样本集进行模型推理后所得到的难区分样本进行合并重新生成未标注样本集等待下一次迭代,直至最后一次计算的评估精度值满足模型精度要求。
[0015]优选的,所述特征提取子模型选取ResNet50模型或mobileNetV3模型;所述分类模型使用1*1卷积核或全连接进行通道变化然后使用softmax损失函数进行分类,所述回归模型使用smooth L1损失函数进行回归。
[0016]与现有技术相比,本专利技术的有益效果是:通过将未标注样本集随机切分生成n份,并将首个候选未标注样本集和预训练模型集送入系统模块,经系统模块训练后生成训练后的模型,然后依次将上一次训练后的模型和下一个候选未标注样本集一起送入系统模块进行模型的迭代训练,如此往复遍历所有候选未标注样本集,可以得到依次变化的模型精度和不断更新训练的模型,可以得到较好的模型训练效果和训练效率。
[0017]训练过程包括分别对特征提取子模型和分类/回归子模型进行推理生成易区分样本和难区分样本,然后对难区分样本进行人工标注,根据人工标注后的信息进行模型再训练生成训练后的模型;由此可以剔除大量易区分样本的标注,充分利用难区分样本进行迭代,有效提升了训练模型的性能。
[0018]模型性能评估还包括依据训练后的模型对测试集合进行性能测试,生成训练后的模型的评估精度,并将每份候选未标注样本集进行模型推理后所得到的难区分样本进行合并重新生成未标注样本集等待下一次迭代,直至最后一次计算的评估精度值满足模型精度要求,大大提高了模型计算的精度。
附图说明
[0019]图1为本专利技术一种面向自动驾驶的图像半自动标注模型训练方法的流程框图;
[0020]图2为本专利技术一种面向自动驾驶的图像半自动标注模型训练方法中系统模块的流程框图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]如图1所示,本专利技术提供的一种面向自动驾驶的图像半自动标注模型训练方法的第一种实施例的整体流程框图,一种面向自动驾驶的图像半自动标注模型训练方法,所述模型训练方法包括将未标注样本集随机切分生成n份候选未标注样本集,将首个候选未标注样本集和预训练模型集送入系统模块,经系统模块训练后生成训练后的模型,然后依次将上一次训练后的模型和下一个候选未标注样本集一起送入系统模块进行模型的迭代训
练,如此往复遍历所有候选未标注样本集。
[0023]优选的,所述预训练模型包括特征提取子模型和分类/回归子模型,所述系统模块的训练过程包括分别对所述特征提取子模型和分类/回归子模型进行推理生成相应的推理结果,然后根据推理结果进行人工标注,根据人工标注后的信息进行模型再训练生成训练后的模型。
[0024]优选的,所述推理结果包括所述特征提取子模型和所述分类/回归子模型针对首个候选未标注样本集相对应的易区分样本和难区分样本;
[0025]所述系统模块的训练过程针对难区分样本进行人工标注。
[0026]优选的,依据平均置信度对易区分样本和难区分样本进行划分,将平均置信度大于0.5的样本划分为易区分样本,将平均置信度小于等于0.5的样本划分为难区分样本。
[0027]优选的,所述系统模块的训练过程还包括对训练后的模型进行模型性能评估,所述模型性能评估参数包括评估精度。
[0028]优选的,所述系统模块的训练过程起始包括将每份候选未标注样本集切分成测试集合和训练集合,所述特征提取子模型和分类/回归子模型对训练集合进行推理;
[0029]所述模型性能评估还包括依据训练后的模型对测试集合进行性能测试,生成训练后的模型的评估精度。
[0030]优选的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向自动驾驶的图像半自动标注模型训练方法,其特征在于,所述模型训练方法包括,将未标注样本集随机切分生成n份候选未标注样本集,将首个候选未标注样本集和预训练模型集送入系统模块,经系统模块训练后生成训练后的模型,然后依次将上一次训练后的模型和下一个候选未标注样本集一起送入系统模块进行模型的迭代训练,如此往复遍历所有候选未标注样本集。2.根据权利要求1所述的一种面向自动驾驶的图像半自动标注模型训练方法,其特征在于,所述预训练模型包括特征提取子模型和分类/回归子模型,所述系统模块的训练过程包括分别对所述特征提取子模型和分类/回归子模型进行推理生成相应的推理结果,然后根据推理结果进行人工标注,根据人工标注后的信息进行模型再训练生成训练后的模型。3.根据权利要求2所述的一种面向自动驾驶的图像半自动标注模型训练方法,其特征在于,所述推理结果包括所述特征提取子模型和所述分类/回归子模型针对首个候选未标注样本集相对应的易区分样本和难区分样本;所述系统模块的训练过程针对难区分样本进行人工标注。4.根据权利要求3所述的一种面向自动驾驶的图像半自动标注模型训练方法,其特征在于,依据平均置信度对易区分样本和难区分样本进行划分,将平均置信度大于0.5的样本划分为易区分样本,将平均置信度小于等于0.5的样本划分为难区分样本。5.根据权利要求4所述的一种面向自动驾驶的图像半自动标注模型训练方法,其特征在于,所述系统模块的训练过程还包括对训练后的模型进行模型性能评估,所述模型性能评估参数包括评估...

【专利技术属性】
技术研发人员:范晟华郭健罗马思阳
申请(专利权)人:苏州安智汽车零部件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1