一种基于主动学习的抽烟检测数据标注方法技术

技术编号:37496334 阅读:22 留言:0更新日期:2023-05-07 09:33
本发明专利技术公开了一种基于主动学习的抽烟检测数据标注方法,该方法包括以下步骤:步骤S1、通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型;步骤S2、将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试;步骤S3、根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选;步骤S4、将筛选的样本通过数据标注员进行针对性标注,重新训练下一代模型,并重复执行步骤S1至步骤S4。本发明专利技术为标注数据和模型迭代提供了新的模式,有效地降低数据标注时间,降低了数据标注员的标注成本和提成迭代模型的效率。代模型的效率。代模型的效率。

【技术实现步骤摘要】
一种基于主动学习的抽烟检测数据标注方法


[0001]本专利技术涉及计算机视觉算法
,具体来说,涉及一种基于主动学习的抽烟检测数据标注方法。

技术介绍

[0002]数据作为人工智能模型中生产资料,是人工智能的四驾马车之一,在实际模型算法落地过程中需要不断迭代模型以适应具体的应用场景,具体来说,当一个检测模型在实际场景中部署后,会因为实际场景下的数据与训练模型时的数据不属于同一个分布,导致会产生各种错误检测和疏漏检测的问题。因此,需要二次采集数据进行数据标注,并重新训练。在这个过程中,有大量相似的数据需要进行标注。由于数据标注员对具体模型训练的细节不了解,无法判断如何丢弃重复数据,导致了巨大的无用工作量,且对迭代模型没有起到推进的作用。除此之外,大量重复无用的数据使得训练时间变长,降低了迭代模型的效率。
[0003]针对于检测公共场所中行人是否抽烟的问题,就目前的情况来说,香烟在具体场景中比较小,容易和手机的边框、卡片等物体进行混淆,会导致检测错误,因此每次在部署后一段时间,会产生大量的误报,需要数据标注员进行大量的重新标注。
...

【技术保护点】

【技术特征摘要】
1.一种基于主动学习的抽烟检测数据标注方法,其特征在于,该方法包括以下步骤:步骤S1、通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型;步骤S2、将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试;步骤S3、根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选;步骤S4、将筛选的样本通过数据标注员进行针对性标注,重新训练下一代模型,并重复执行步骤S1至步骤S4。2.根据权利要求1所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型包括以下步骤:步骤S11、对网络中的香烟特写图片和香烟售卖时的展示图片集进行采集;步骤S12、使用YOLOv7官方提供的训练脚本进行模型训练,得到初代模型。3.根据权利要求2所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试包括以下步骤:步骤S21、将模型部署至实际应用场景中,通过摄像头采集实际图像对模型进行错误检测;步骤S22、错误检测的图片通过审查员进行批准、记录、保存,得到包含错误数据集的数据库。4.根据权利要求3所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选包括以下步骤:步骤S31、利用主动学习对数据进行筛选;步骤S32、通过评估偶尔不确定性和认知不确定性计算图片的信息量得分,判断图片是否被标注。5.根据权利要求4所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述利用主动学习对数据进行筛选包括以下步骤:步骤S311、在YOLOv7输出层后接入高斯混合密度网络预测混合高斯分布的均值 和方差,计算出偶尔不确定性和认知不确定性;步骤S312、对于目标框的位置,通过高斯混合密度网络模型输出三组参数;步骤S313、根据参数计算出目标框位置信息的高斯分布权重、高斯分布均值和高斯分布方差。6.根据权利要求5所述的一种基于主动学习的抽烟检测...

【专利技术属性】
技术研发人员:刘鹏张真张堃王美民江兴斌
申请(专利权)人:南京云创大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1