【技术实现步骤摘要】
一种基于时序方差阈值的目标检测主动采样方法
[0001]本专利技术属于数字图像自动标注
,尤其涉及一种基于时序方差阈值的目标检测主动采样方法。
技术介绍
[0002]在实际工业应用过程中,数据作为工业互联网的核心资源一直被重视。海量数据在人、机、物互联后产生,推动着工业往前发展,可是这些数据里也通常含有大量的冗余数据,数据提取与清洗成为当务之急。其中一个突出表现的领域便是自动驾驶的时序数据,自动驾驶数据通常是截取自摄像头记录下的多个驾驶片段,每个片段里包含着驾驶场景中的连续图片,即时序帧。针对该类数据,利用主动学习算法进行选择性采样,可以减少冗余信息,并提取出最有效的部分。若仅通过不确定性选帧,虽然选择的都是模型不确定的帧,但是很可能相邻的帧过于相似,没有必要全部选择标注,否则容易造成数据冗余。因此结合单个样本帧的时序方差计算方法,在选取模型不确定大的帧的同时,也要满足一定的时序不相似性。当前工业界对于时序数据采取全部标注或是每隔一段时间间隔采样一次。前者的标注代价过大,而后者采样具有随机性,可能会丢失关键信息。 />
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种基于时序方差阈值的目标检测主动采样方法,其特征在于,包括以下步骤:步骤1、收集的无标注时序数据图像集合L和已标注时序图像数据集合U;步骤2、设置计划查询样本数n,以及方差阈值δ,将已挑选样本数q初始化为0;步骤3、使用已标注图像集对模型进行初始化目标检测模型;步骤4、目标检测模型输出对无标注帧的预测结果;步骤5、根据预测结果对各个未标注帧计算每次迭代的模型不确定性大小,并从大到小排列;步骤6、取模型不确定性最大的样本,若该样本的时序方差大于阈值且相邻帧未被选取,则向专家查询标记该样本;步骤7、更新已标注图像集和未标注图像集U,并更新预测模型;步骤8、返回步骤4或已选择查询完足够的样本并输出目标检测模型f。2.根据权利要求1所述的基于时序方差阈值的目标检测主动采样方法,其特征在于,步骤5中各个未标注帧计算每次迭代的模型不确定性大小的具体方法为:步骤5.1:输入一段的时序数据帧F,将其平均分为k个小段,即,每一个小段内含有n个样本帧,即;模型对于每一帧样本都会输出预测值,即对于,都有;对于每一个小段
ꢀꢀ
,根据其中n帧输出的n个值计算一个方差,得到;将计算得到的方差,视为k个小段的评价指标进行查询,方差越大的小段,则在其中挑选更多的样本帧;步骤5.2:步骤5.1中涉及的方差计算方法如下:目标检测模型对于一张图片检测出的物体位置,种类以及置信度进行输出,若某张图片一共检测出k个物体,则输出可以表示为:其中 ;统计该样本中属于第i类物体的均值,若目标检测任务中总共有C类物体,则将一张图片的输出归一化为一类向量:一个向量表示了一个样本中每一类物体的平均位置以及平均置信度;步骤5.3:在训练过程中,进行多轮训练,每轮过后模型都会更新迭代,每一次迭代后的模型都会对未标注样本有一个输出,其中若...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。