一种训练样本生成方法及装置、设备、介质制造方法及图纸

技术编号:20222270 阅读:22 留言:0更新日期:2019-01-28 20:37
本申请公开了一种训练样本生成方法及装置、设备、介质。该方法至少包括:从同一图像数据集中,获取多个第一训练样本,根据第一训练样本的第i‑1轮扰动,以及第i‑1轮迭代训练时损失函数对应的梯度,计算第i轮扰动,训练时每个第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签,根据分别计算出的第i轮扰动,确定该同一图像数据集的通用扰动,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,根据统一的通用扰动生成第二训练样本。本申请通过迭代训练以及对抗扰动通用化和统一化,能够根据已有的训练样本生成新的训练样本,以作为对抗样本对深度模型进行对抗训练,成本较低,而且能够有效地提高模型鲁棒性。

【技术实现步骤摘要】
一种训练样本生成方法及装置、设备、介质
本申请涉及机器学习
,尤其涉及一种训练样本生成方法及装置、设备、介质。
技术介绍
随着机器学习技术的迅速发展,基于深度学习的深度模型也被用在越来越多的地方,包括图像分割领域。利用深度模型来进行图像分割的流程与一般的图像分类相似,但是需要尽量为每个像素都正确分类。针对图像分割领域,为了提高深度模型分类的准确性,需要利用大量图像作为训练样本对深度模型进行训练,训练过的深度模型仍难免出现混淆现象,需要进一步地优化。优化技术在应对混淆现象的时候,多在模型结构或者数据上着力。模型结构上优化主要指的是依据现有的研究得到的,在模型结构和训练上一些可以使用的技巧,这些一般在正常的训练中已经被采用。而数据上优化一般更为有效,因为深度模型本来就是数据驱动的机器学习模型。但是,数据上优化目前是努力采集更多的图像作为新的训练样本,再用这些新的训练样本来再次更新模型的参数,但是,这种方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。
技术实现思路
本申请实施例提供一种训练样本生成方法及装置、设备、介质,用以解决现有技术中的如下技术问题:现有的努力采集更多的新的训练样本的方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。本申请实施例采用下述技术方案:一种训练样本生成方法,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。可选地,在所述生成所述深度模型的第二训练样本后,所述方法还包括:利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。可选地,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:获取分别为多个不同图像数据集确定的通用扰动;对获取的各所述通用扰动进行归一化处理;根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。可选地,所述计算所述第一训练样本的第i轮扰动,具体包括:利用快速梯度算法,计算所述第一训练样本的第i轮扰动;其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。可选地,所述计算过程中还使用了指定的随机扰动及其相关控制因子。可选地,所述确定该同一图像数据集的通用扰动,具体包括:采用以下公式,确定该同一图像数据集的通用扰动:其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。可选地,所述确定统一的通用扰动,具体包括:采用以下公式,确定统一的通用扰动:其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。可选地,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:采用以下公式,计算所述第一训练样本的第i轮扰动:Ladv=w×L;其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。可选地,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:采用以下公式,计算所述第一训练样本的第i轮扰动:Ladv=w×L;其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。可选地,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。可选地,所述深度模型包括图像分割模型,所述图像包括道路交通图像。一种训练样本生成装置,包括:获取模块,从同一图像数据集中,获取深度模型的多个第一训练样本;计算模块,根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;第一确定模块,根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;第二确定模块,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;生成模块,根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。可选地,所述装置还包括:训练模块,在所述生成模块生成所述深度模型的第二训练样本后,利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。可选地,所述第二确定模块根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:所述第二确定模块获取分别为多个不同图像数据集确定的通用扰动;对获取的各所述通用扰动进行归一化处理;根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。可选地,所述计算模块计算所述第一训练样本的第i轮扰动,具体包括:所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动;其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。可选地,所述计算过程中还使用了指定的随机扰动及其相关控制因子。可选地,所述第一确定模块确定该同一图像数据集的通用扰动,具体包括:所述第一确定模块采用以下公式,确定该同一图像数据集的通用扰动:其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。可选地,所述第二确定模块确定统一的通用扰动,具体包括:所述第二确定模块采用以下公式,确定统一的通用扰动:其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机本文档来自技高网...

【技术保护点】
1.一种训练样本生成方法,其特征在于,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i‑1轮扰动,以及第i‑1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。

【技术特征摘要】
1.一种训练样本生成方法,其特征在于,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。2.如权利要求1所述的方法,其特征在于,在所述生成所述深度模型的第二训练样本后,所述方法还包括:利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。3.如权利要求1所述的方法,其特征在于,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:获取分别为多个不同图像数据集确定的通用扰动;对获取的各所述通用扰动进行归一化处理;根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。4.如权利要求1所述的方法,其特征在于,所述计算所述第一训练样本的第i轮扰动,具体包括:利用快速梯度算法,计算所述第一训练样本的第i轮扰动;其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。5.如权利要求4所述的方法,其特征在于,所述计算过程中还使用了指定的随机扰动及其相关控制因子。6.如权利要求1所述的方法,其特征在于,所述确定该同一图像数据集的通用扰动,具体包括:采用以下公式,确定该同一图像数据集的通用扰动:其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。7.如权利要求3所述的方法,其特征在于,所述确定统一的通用扰动,具体包括:采用以下公式,确定统一的通用扰动:其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。8.一种训练样本生成装置,其特征在...

【专利技术属性】
技术研发人员:高三元徐晓刚
申请(专利权)人:宽凳北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1