一种训练样本的确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35698527 阅读:15 留言:0更新日期:2022-11-23 14:50
本申请提供了一种训练样本的确定方法、装置、电子设备和存储介质,所述方法包括:获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;针对目标图像,确定同一点位上的每个标注数据的平均标注结果;确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。本申请提升了模型的精度。升了模型的精度。升了模型的精度。

【技术实现步骤摘要】
一种训练样本的确定方法、装置、电子设备和存储介质


[0001]本申请涉及神经网络
,尤其涉及一种训练样本的确定方法、装置、电子设备和存储介质。

技术介绍

[0002]随着技术的发展,关键点检测技术已经经历了飞速的发展,技术手段也相对完善,无论是应用于移动端的快速检测技术还是应用于云端的高精度检测技术均得到了飞速的发展。
[0003]关键点检测的精确度依赖于数据的标注精确度,一般模型训练的数据不一定来自同一个标注平台。由于各个标注平台的标注标准和规则各不相同,对于同一张图像,使用不同的标注员标注或者不同的标注标准,均会导致标注点位的偏差。对于模型训练来讲,这种标注偏差会导致模型在训练过程中无法得到精准的学习,从而产生点位的抖动,导致模型训练精度低。然而开源数据的数据量庞大,若使用统一标准,让人工进行统一标注和修正,工作量巨大,耗时耗力。
[0004]针对目前模型训练精度低的问题,目前尚无良好的解决方案。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述模型训练精度低的技术问题,本申请提供了一种训练样本的确定方法、装置、电子设备和存储介质。
[0006]第一方面,本申请提供了一种训练样本的确定方法,所述方法包括:
[0007]获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;
[0008]针对目标图像,确定同一点位上的每个标注数据的平均标注结果;
[0009]确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;
[0010]若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。
[0011]可选地,所述偏差包括平均点位偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:
[0012]针对每种标注方式执行如下操作:
[0013]针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离;
[0014]将每个点位的距离的加和平均值作为所述平均点位偏差。
[0015]可选地,所述偏差包括点位方差偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:
[0016]针对每种标注方式执行如下操作:
[0017]针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离的平方;
[0018]将每个点位的距离平方和的平均值作为所述点位方差偏差。
[0019]可选地,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:
[0020]若所述目标图像满足以下两种条件中的至少一个,则将携带有所述平均标注结果的目标图像作为训练样本;
[0021]其中,两种条件分别为:每种标注方式的平均点位偏差小于设定偏差值,和每种标注方式的点位方差偏差小于预设偏差值。
[0022]可选地,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:
[0023]若所述目标图像的每种标注方式的平均点位偏差小于设定偏差值、且每种标注方式的点位方差偏差小于预设偏差值,则将携带有所述平均标注结果的目标图像作为训练样本。
[0024]可选地,将携带有所述平均标注结果的目标图像作为初始训练样本之后,所述方法还包括:
[0025]对所述初始训练样本进行在线增广,得到最终训练样本,其中,所述在线增广包括图像平移、旋转、添加噪声、模糊处理、对比度和光照变化。
[0026]可选地,对所述初始训练样本进行在线增广之前,所述方法还包括:
[0027]采用检测模型确定所述目标图像中图像检测框的检测框位置;
[0028]以所述检测框位置为基准,对所述图像检测框进行扩充,其中,扩充后的图像检测框能够完全覆盖待检测的图像;
[0029]根据待检测的图像的尺寸,对扩充后的图像检测框进行裁剪。
[0030]第二方面,提供了一种训练样本的确定装置,所述装置包括:
[0031]获取模块,用于获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;
[0032]第一确定模块,用于针对目标图像,确定同一点位上的每个标注数据的平均标注结果;
[0033]第二确定模块,用于确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;
[0034]作为模块,用于若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。
[0035]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0036]存储器,用于存放计算机程序;
[0037]处理器,用于执行存储器上所存放的程序时,实现任一所述的训练样本的确定方法步骤。
[0038]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现任一所述的训练样本的确定方法步骤。
[0039]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
[0040]本申请实施例提供的该方法,针对不同标注方式得到的标注数据,服务器获取这些标注数据的平均标注结果,平均标注结果可以有效降低标注方式不同所带来的点位偏差
和抖动,若每种标注方式的标注数据和平均标注结果之间的数据偏差均在预设偏差范围内,那么认为各标注数据之间的数据偏差并不大,可以采用平均标注结果作为最终的标注数据,这样就统一了图像的标注数据的标注规则,提升标注数据的准确度,从而有效提升模型的精度。
附图说明
[0041]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0042]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本申请实施例提供的一种训练样本的确定方法的流程图;
[0044]图2为本申请实施例提供的人脸检测校正示意图;
[0045]图3为本申请实施例提供的一种训练样本的确定训练样本的确定流程图
[0046]图4为本申请实施例提供的一种训练样本的确定装置的结构示意图;
[0047]图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0048]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本的确定方法,其特征在于,所述方法包括:获取包括多个图像的标注集合,其中,每个图像的同一点位上具有多个标注数据,每个标注数据的标注方式不同;针对目标图像,确定同一点位上的每个标注数据的平均标注结果;确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差;若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为初始训练样本。2.根据权利要求1所述的方法,其特征在于,所述偏差包括平均点位偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:针对每种标注方式执行如下操作:针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离;将每个点位的距离的加和平均值作为所述平均点位偏差。3.根据权利要求1所述的方法,其特征在于,所述偏差包括点位方差偏差,所述确定每种标注方式的标注数据和所述平均标注结果之间的数据偏差包括:针对每种标注方式执行如下操作:针对同一点位,确定标注数据的坐标和平均标注结果的坐标之间的距离的平方;将每个点位的距离平方和的平均值作为所述点位方差偏差。4.根据权利要求2或3所述的方法,其特征在于,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:若所述目标图像的每种标注方式产生的标注数据的平均点位偏差均小于设定偏差值,或每种标注方式产生的标注数据的点位方差偏差均小于预设偏差值,则将携带有所述平均标注结果的目标图像作为训练样本。5.根据权利要求4所述的方法,其特征在于,若每种标注方式产生的标注数据的数据偏差均位于预设偏差范围内,则将携带有所述平均标注结果的目标图像作为训练样本包括:若所述目标图像的每种标注方式产生的标注数据的平均点位偏差均小于设定偏差值、且每种标注方式产生的标...

【专利技术属性】
技术研发人员:吴佳涛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1