用于提取难样本的方法、装置及机械设备制造方法及图纸

技术编号:33645830 阅读:20 留言:0更新日期:2022-06-02 20:22
本申请公开了一种用于提取难样本的方法、装置及机械设备。该方法包括:获取候选关键帧;根据候选关键帧构建语义分割模型;通过语义分割模型确定预测难样本以及边缘标记样本;对边缘标记样本进行筛选以得到标记难样本;根据预测难样本和标记难样本确定候选难样本。本申请通过语义分割模型确定预测难样本和边缘标记样本,通过多种筛选方式,降低了人工待确认图片的规模,提高难样本的识别效率,提高难样本的样本库的质量。的样本库的质量。的样本库的质量。

【技术实现步骤摘要】
用于提取难样本的方法、装置及机械设备


[0001]本申请涉及智能监控
,具体地,涉及一种用于提取难样本的方法、装置及机械设备。

技术介绍

[0002]语义分割标签制作要求对样本图片中各个感兴趣区域的边缘点集能够进行准确标注。但是由于标注成本较高,构建一个一定规模、合格的样本库需要耗费较大的成本。目前对于高价值样本(难样本)的评价主要还是以标签为基准的,以最终的损失函数或者其变种作为最终量化评价标准。现有技术中,对于难样本的提取是在模型训练过程中定义相关规则来挖掘难样本,这并不能减少标注量;或者人力观察数据进行选择性标注,这对于样本价值识别具有一定的盲目性,无法保障样本库的质量,且耗费大量人力。因此,现有技术无法降低标注数量且无法直观评价样本价值,从而导致难样本的提取效率较低。

技术实现思路

[0003]本申请的目的是提供一种用于提取难样本的方法、装置及机械设备,用以解决现有技术无法降低标注数量且无法直观评价样本价值,从而导致难样本的提取效率较低的问题。
[0004]为了实现上述目的,本申请第一方面提供一种用于提取难本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于提取难样本的方法,其特征在于,包括:获取候选关键帧;根据所述候选关键帧构建语义分割模型;通过所述语义分割模型确定预测难样本以及边缘标记样本;对所述边缘标记样本进行筛选以得到标记难样本;根据所述预测难样本和所述标记难样本确定候选难样本。2.根据权利要求1所述的方法,其特征在于,所述根据所述候选关键帧构建语义分割模型包括:将所述候选关键帧分为多组候选关键帧;选取预设组的候选关键帧进行标注,以得到初始样本库;根据所述初始样本库训练所述语义分割模型,所述语义分割模型用于预测剩余候选关键帧;在每预测一组剩余候选关键帧之后,更新所述初始样本库并重新训练所述语义分割模型,以更新所述语义分割模型。3.根据权利要求2所述的方法,其特征在于,所述在每预测一组剩余候选关键帧之后,更新所述初始样本库并重新训练所述语义分割模型,以更新所述语义分割模型包括:将当前组对应的预测难样本加入上一组更新后的初始样本库中,以得到当前样本库;根据当前样本库重新训练所述语义分割模型,以得到当前语义分割模型;所述当前语义分割模型用于预测下一组剩余候选关键帧。4.根据权利要求1所述的方法,其特征在于,所述通过所述语义分割模型确定预测难样本以及边缘标记样本包括:针对每张候选关键帧,确定当前候选关键帧的最大概率层及次大概率层的差值图;统计所述差值图中差值小于第一阈值的目标像素数量;确定所述目标像素数量与当前候选关键帧的总像素数量的比值;判断所述比值是否大于第二阈值;在所述比值大于所述第二阈值的情况下...

【专利技术属性】
技术研发人员:付玲周志忠秦拯向超前虢彦
申请(专利权)人:中科云谷科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1