基于主动学习的目标检测数据挑选方法、装置制造方法及图纸

技术编号:38346845 阅读:18 留言:0更新日期:2023-08-02 09:26
本发明专利技术公开了一种基于主动学习的目标检测数据挑选方法、装置,所述方法包括:将时序数据划分为多段子片段时序数据;使用目标模型,对每段子片段时序数据进行输出预测,得到相应的子片段预测输出;子片段预测输出包括多个样本预测结果,样本预测结果为样本数据的预测结果;计算样本预测结果的样本离散程度,并从多段子片段时序数据中筛选得到候选子片段时序数据;使用候选子片段时序数据,对目标模型进行多轮训练;计算各轮训练的训练预测结果的训练离散程度,并从候选子片段时序数据中筛选用于目标模型训练的训练数据。采用上述技术方案,可以从海量训练数据中,快速的查询得到对于训练更有帮助的训练数据,能减少标注的代价。价。价。

【技术实现步骤摘要】
基于主动学习的目标检测数据挑选方法、装置


[0001]本专利技术涉及图像深度学习
,尤其涉及一种基于主动学习的目标检测数据挑选方法、装置。

技术介绍

[0002]近些年来,深度学习与人工智能的研究和发展持续升温,图像检测作为AI的前沿应用场景之一,一直以来也是备受关注,对图像检测的研究也是持续不断。随着5G、人工智能等相关技术的不断发展,图像检测的相关研究已慢慢走向成熟,开始应用在实际生活中的各个方面。
[0003]图像检测受限于低成本要求,对算力、标注数据质量等有很高要求。5G和AI催生边缘计算发展并通过边缘计算提供算力,而最大化利用深度学习方法,则可以充分利用海量数据,搭建出更符合实际应用的模型。然而,深度学习往往是一个监督学习任务,需要大量可靠有用的已标注样本,在图像检测问题中,虽然可以获取海量数据,可是数据类别复杂,内容多样,且获取类别标签困难,通常需要人工进行标注,代价非常昂贵。由此可以看出,怎样从海量复杂的数据中选择模型最需要的少量数据进行标注是一项非常有意义的工作。
[0004]在海量log数据中,数据量非常本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于主动学习的目标检测数据挑选方法,其特征在于,包括:获取时序数据,将时序数据划分为多段子片段时序数据;每段子片段时序数据包括多个样本数据;使用目标模型,对每段子片段时序数据进行输出预测,得到相应的子片段预测输出;所述子片段预测输出包括多个样本预测结果,所述样本预测结果为所述样本数据的预测结果;计算每段子片段预测输出中样本预测结果的样本离散程度,根据样本离散程度从多段子片段时序数据中筛选得到候选子片段时序数据;使用候选子片段时序数据中的样本数据,对目标模型进行多轮训练,获得每轮训练的训练预测结果;计算各轮训练的训练预测结果的训练离散程度,按照训练离散程度从候选子片段时序数据中筛选用于目标模型训练的训练数据。2.根据权利要求1所述的基于主动学习的目标检测数据挑选方法,其特征在于,所述每段子片段时序数据包括多个连续的样本数据。3.根据权利要求2所述的基于主动学习的目标检测数据挑选方法,其特征在于,所述计算每段子片段预测输出中样本预测结果的样本离散程度,包括:将样本预测结果表示为预测目标框位置、概率最大类别和置信度三个向量,将概率最大类别分别取各个不同的目标类别时的预测目标框位置均值和置信度均值组成向量序列,作为样本预测结果向量序列;计算样本预测结果向量序列的样本方差。4.根据权利要求3所述的基于主动学习的目标检测数据挑选方法,其特征在于,所述计算每段子片段预测输出中样本预测结果的样本离散程度,包括:计算每段子片段预测输出的样本方差均值,作为样本离散程度。5.根据权利要求4所述的基于主动学习的目标检测数据挑选方法,其特征在于,所述根据样本离散程度从多段子片段时序数据中筛选得到候选子片段时序数据,包括:若样本离散程度高于候选方差数值,则将对应的子片段时序数据筛选作为候选子片段时序数据。6.根据权利要求1所述的基于主动学习的目标检测数据挑选方法,其特征在于,使用未标注的候选子片段时序数据,对目标模型进行多轮训练。7.根据权利要求6所述...

【专利技术属性】
技术研发人员:王威张弦王鹏吴小志赵仰东张锦辉严娇娇赵宇轩王想赵裕啸
申请(专利权)人:南瑞集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1