【技术实现步骤摘要】
一种训练样本生成方法及装置、设备、介质
本申请涉及机器学习
,尤其涉及一种训练样本生成方法及装置、设备、介质。
技术介绍
随着机器学习技术的迅速发展,基于深度学习的深度模型也被用在越来越多的地方,包括图像分割领域。利用深度模型来进行图像分割的流程与一般的图像分类相似,但是需要尽量为每个像素都正确分类。针对图像分割领域,为了提高深度模型分类的准确性,需要利用大量图像作为训练样本对深度模型进行训练,训练过的深度模型仍难免出现混淆现象,需要进一步地优化。优化技术在应对混淆现象的时候,多在模型结构或者数据上着力。模型结构上优化主要指的是依据现有的研究得到的,在模型结构和训练上一些可以使用的技巧,这些一般在正常的训练中已经被采用。而数据上优化一般更为有效,因为深度模型本来就是数据驱动的机器学习模型。但是,数据上优化目前是努力采集更多的图像作为新的训练样本,再用这些新的训练样本来再次更新模型的参数,但是,这种方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。
技术实现思路
本申请实施例提供一种训练样本生成方法及装置、设备、介质,用以解决现有技术中的如下技术问题:现有的努力采集更多的新的训练样本的方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。本申请实施例采用下述技术方案:一种训练样本生成方法,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于 ...
【技术保护点】
1.一种训练样本生成方法,其特征在于,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i‑1轮扰动,以及第i‑1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
【技术特征摘要】
1.一种训练样本生成方法,其特征在于,包括:从同一图像数据集中,获取深度模型的多个第一训练样本;根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。2.如权利要求1所述的方法,其特征在于,在所述生成所述深度模型的第二训练样本后,所述方法还包括:利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。3.如权利要求1所述的方法,其特征在于,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:获取分别为多个不同图像数据集确定的通用扰动;对获取的各所述通用扰动进行归一化处理;根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。4.如权利要求1所述的方法,其特征在于,所述计算所述第一训练样本的第i轮扰动,具体包括:利用快速梯度算法,计算所述第一训练样本的第i轮扰动;其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。5.如权利要求4所述的方法,其特征在于,所述计算过程中还使用了指定的随机扰动及其相关控制因子。6.如权利要求1所述的方法,其特征在于,所述确定该同一图像数据集的通用扰动,具体包括:采用以下公式,确定该同一图像数据集的通用扰动:其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。7.如权利要求3所述的方法,其特征在于,所述确定统一的通用扰动,具体包括:采用以下公式,确定统一的通用扰动:其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。8.一种训练样本生成装置,其特征在...
【专利技术属性】
技术研发人员:高三元,徐晓刚,
申请(专利权)人:宽凳北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。