一种训练样本的确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35698527 阅读:24 留言:0更新日期:2022-11-23 14:50
本申请提供了一种训练样本的确定方法、装置、电子设备和存储介质,所述方法包括:获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;针对目标图像,确定同一点位上的每个标注数据的平均标注结果;确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。本申请提升了模型的精度。升了模型的精度。升了模型的精度。

【技术实现步骤摘要】
一种训练样本的确定方法、装置、电子设备和存储介质


[0001]本申请涉及神经网络
,尤其涉及一种训练样本的确定方法、装置、电子设备和存储介质。

技术介绍

[0002]随着技术的发展,关键点检测技术已经经历了飞速的发展,技术手段也相对完善,无论是应用于移动端的快速检测技术还是应用于云端的高精度检测技术均得到了飞速的发展。
[0003]关键点检测的精确度依赖于数据的标注精确度,一般模型训练的数据不一定来自同一个标注平台。由于各个标注平台的标注标准和规则各不相同,对于同一张图像,使用不同的标注员标注或者不同的标注标准,均会导致标注点位的偏差。对于模型训练来讲,这种标注偏差会导致模型在训练过程中无法得到精准的学习,从而产生点位的抖动,导致模型训练精度低。然而开源数据的数据量庞大,若使用统一标准,让人工进行统一标注和修正,工作量巨大,耗时耗力。
[0004]针对目前模型训练精度低的问题,目前尚无良好的解决方案。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述模型训练精度低的技术问题,本申请提供了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种训练样本的确定方法,其特征在于,所述方法包括:获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;针对目标图像,确定同一点位上的每个标注数据的平均标注结果;确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。2.根据权利要求1所述的方法,其特征在于,所述偏差包括平均点位偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:针对每种标注方式执行如下操作:针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离;将每个点位的距离的加和平均值作为所述平均点位偏差。3.根据权利要求1所述的方法,其特征在于,所述偏差包括点位方差偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:针对每种标注方式执行如下操作:针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离的平方;将每个点位的距离平方和的平均值作为所述点位方差偏差。4.根据权利要求2或3所述的方法,其特征在于,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:若所述目标图像的每种标注方式产生的标注数据的平均点位偏差均小于设定偏差值,或每种标注方式产生的标注数据的点位方差偏差均小于预设偏差值,则将携带有所述平均标注结果的目标图像作为训练样本。5.根据权利要求4所述的方法,其特征在于,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:若所述目标图像的每种标注方式产生的标注数据的平均点位偏差均小于设定偏差值、且每种标注方式产生的标...

【专利技术属性】
技术研发人员:吴佳涛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1