训练样本筛选方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:33082298 阅读:28 留言:0更新日期:2022-04-15 10:38
本申请涉及一种训练样本筛选方法、装置、计算机设备和存储介质。所述方法包括:随机阻断图像处理模型中的神经元得到阻断模型,并通过阻断模型对当前训练样本进行图像处理,得到第一处理结果;对于当前训练样本,基于与多次随机阻断分别对应的第一处理结果,确定对应的模型度量表征向量;获取通过对当前训练样本进行图像变换得到的变换样本,通过图像处理模型对变换样本进行图像处理,得到第二处理结果;基于与相对应的多个变换样本的第二处理结果,确定对应的图像度量表征向量;综合模型度量表征向量和图像度量表征向量得到综合度量结果,根据训练样本集中每个训练样本的综合度量结果筛选出目标训练样本。采用本方法能够提升模型的训练效果。型的训练效果。型的训练效果。

【技术实现步骤摘要】
训练样本筛选方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种训练样本筛选方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着科学技术的发展,图像处理模型的应用也越来越广泛,例如,可通过图像处理模型进行人脸的识别、热力图关键点识别或者车牌识别等。
[0003]在通过图像处理模型对图像进行处理之前,需要对图像处理模型进行训练。目前,主要是随机挑选出训练样本,并对随机挑选的训练样本进行标签标注处理,再通过添加有标签的训练样本对图像处理模型进行训练。
[0004]然而,当训练样本库中存在很多相似、冗余的训练样本时,随机挑选训练样本的方法容易挑选到很多无价值的训练样本,从而导致基于无价值的训练样本降低图像处理模型的训练效果。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提升图像识别模型的训练效果的训练样本筛选方法、装置、计算机设备和存储介质。
[0006]一种训练样本筛选方法,所述方法包括:
[0007]随机阻断图像处理模型中的神经元本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种训练样本筛选方法,其特征在于,所述方法包括:随机阻断图像处理模型中的神经元得到阻断模型,并通过所述阻断模型对训练样本集中的当前训练样本进行图像处理,得到第一处理结果;对于所述当前训练样本,基于与多次随机阻断分别对应的第一处理结果,确定对应的模型度量表征向量,所述模型度量表征向量用于表征模型不确定性;获取通过对所述当前训练样本进行图像变换得到的变换样本,并通过所述图像处理模型对所述变换样本进行图像处理,得到第二处理结果;对于所述当前训练样本,基于与相对应的多个变换样本的第二处理结果,确定对应的图像度量表征向量,所述图像度量表征向量用于表征图像不确定性;综合所述模型度量表征向量和所述图像度量表征向量得到综合度量结果,并根据所述训练样本集中每个训练样本的综合度量结果筛选出目标训练样本;筛选出的所述目标训练样本用于对图像处理模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述随机阻断图像处理模型中的神经元得到阻断模型,并通过所述阻断模型对训练样本集中的当前训练样本进行图像处理,得到第一处理结果,包括:对于训练样本集中的当前训练样本,随机阻断所述图像识别模型中的第一预设数量的神经元,得到阻断模型,并通过所述阻断模型对所述当前训练样本进行图像识别,得到第一处理结果;进入下一轮的图像识别,返回随机阻断所述图像识别模型中的第一预设数量的神经元的步骤继续执行,直至满足第一预设停止条件时停止,得到所述当前训练样本所对应的多个第一处理结果。3.根据权利要求1所述的方法,其特征在于,所述对于所述当前训练样本,基于与多次随机阻断分别对应的第一处理结果,确定对应的模型度量表征向量,包括:对于所述当前训练样本,对与多次随机阻断对应的多个第一处理结果进行求均值运算,得到与所述当前训练样本对应的第一均值结果;确定与所述当前训练样本对应的每个第一处理结果与所述第一均值结果之间的差异,得到每个所述第一处理结果各自对应的第一差异结果;综合多个所述第一差异结果,得到所述当前训练样本的模型度量表征向量。4.根据权利要求3所述的方法,其特征在于,所述综合多个所述第一差异结果,得到所述当前训练样本的模型度量表征向量,包括:对多个所述第一差异结果进行求均值运算,得到第一均值差异;对多个所述第一差异结果进行求方差运算,得到第一方差差异;确定多个所述第一差异结果中的最大值,得到第一最大差异;综合所述第一均值差异、所述第一方差差异和所述第一最大差异,得到所述当前训练样本的模型度量表征向量。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:调整当前训练样本的亮度、对比度、饱和度和锐度中的至少一种,得到与所述当前训练样本对应的颜色扰动样本;对所述颜色扰动样本中的像素点进行像素位移,得到与所述当前训练样本对应的变换
样本;进入下一轮的图像变换,返回调整当前训练样本的亮度、对比度、饱和度和锐度中的至少一种的步骤继续执行,直至满足第二预设停止条件时停止,得到与所述当前训练样本对应的多个变换样本。6.根据权利要求1所述的方法,其特征在于,所述对于所述当前训练样本,基于与相对应的多个变换样本的第二处理结果,确定对应的图像度量表征向量,包括:对于所述当前训练样本,对与所述当前训练样本对应的多个第二处理结果进行求均值运算,得到与当前训练样本对应的第二均值结果;确定与所述当前训练样本对应的每个第二处理结果与所述第二均值结果之间的差异,得到每个所述第二处理结果各自对应的第二差异结果;综合多个所述第二差异结果,得到与所述当前训练样本相对应的图像度量表征向量。7.根据权利要求6所述的方法,其特征在于,所述综合多个所述第二差异结果,得到与所述当前训练样本相对应的图像度量表征向量,包括:对多个所述第二差异结果进行求均值运算,得到第二均值差异;对多个所述第二差异结果进行求方差运算,得到第二方差差异;确定多个所述第二差异结果中的最大值,得到第二最大差异;综合所述第二均值差异、所述第二方差差异和所述第二最大差异,得到所述当前训练样本的图像度量表征向量。8.根据权利要求1所述的方法,其特征在于,所述训练样本集包括第一训练样本集和第二训练样本集,所述第一训练样本集包括具有标签的第一训练样本;所述第二训练样本集中包括不具有标签的第二训练样本;所述综合所述模型度量表征向量和所述图像度量表征向量得到综合度量结果,包括:分别对每个所述第一训练样本各自对应的模型度量表征向量和图像度量表征向量进行拼接,得到每个所述第一训练样本各自对应的第一综合度量结果;分别对每个所述第二训练样本各自对应的模型度量表征向量和图像度量表征向量进行拼接,得到每个所述第二训练样本各自对应的第二综合度量结果。9.根据权利要求8所述的方法,其特征在于,所述根据所述训练样本集中每个训练样本的综合度量结果筛选出目标训练样本,包括:对...

【专利技术属性】
技术研发人员:徐列孙冲康洋付灿苗
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1