一种训练样本生成方法及装置、设备、介质制造方法及图纸

技术编号：20222270 阅读：22 留言：0更新日期：2019-01-28 20:37

本申请公开了一种训练样本生成方法及装置、设备、介质。该方法至少包括：从同一图像数据集中，获取多个第一训练样本，根据第一训练样本的第i‑1轮扰动，以及第i‑1轮迭代训练时损失函数对应的梯度，计算第i轮扰动，训练时每个第一训练样本中的一部分像素采用错误分类标签，另一部分像素采用正确分类标签，根据分别计算出的第i轮扰动，确定该同一图像数据集的通用扰动，根据分别为多个不同图像数据集确定的通用扰动，确定统一的通用扰动，根据统一的通用扰动生成第二训练样本。本申请通过迭代训练以及对抗扰动通用化和统一化，能够根据已有的训练样本生成新的训练样本，以作为对抗样本对深度模型进行对抗训练，成本较低，而且能够有效地提高模型鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练样本生成方法及装置、设备、介质
本申请涉及机器学习
，尤其涉及一种训练样本生成方法及装置、设备、介质。
技术介绍
随着机器学习技术的迅速发展，基于深度学习的深度模型也被用在越来越多的地方，包括图像分割领域。利用深度模型来进行图像分割的流程与一般的图像分类相似，但是需要尽量为每个像素都正确分类。针对图像分割领域，为了提高深度模型分类的准确性，需要利用大量图像作为训练样本对深度模型进行训练，训练过的深度模型仍难免出现混淆现象，需要进一步地优化。优化技术在应对混淆现象的时候，多在模型结构或者数据上着力。模型结构上优化主要指的是依据现有的研究得到的，在模型结构和训练上一些可以使用的技巧，这些一般在正常的训练中已经被采用。而数据上优化一般更为有效，因为深度模型本来就是数据驱动的机器学习模型。但是，数据上优化目前是努力采集更多的图像作为新的训练样本，再用这些新的训练样本来再次更新模型的参数，但是，这种方式费时耗力，成本较高，而且难以有针对性地应对混淆现象，从而难以保证模型鲁棒性。
技术实现思路
本申请实施例提供一种训练样本生成方法及装置、设备、介质，用以解决现有技术中的如下技术问题：现有的努力采集更多的新的训练样本的方式费时耗力，成本较高，而且难以有针对性地应对混淆现象，从而难以保证模型鲁棒性。本申请实施例采用下述技术方案：一种训练样本生成方法，包括：从同一图像数据集中，获取深度模型的多个第一训练样本；根据所述第一训练样本的第i-1轮扰动，以及第i-1轮迭代训练时损失函数对应的梯度，计算所述第一训练样本的第i轮扰动，所述第i轮扰动用于在第i轮迭代训练时叠加于...

【技术保护点】
1.一种训练样本生成方法，其特征在于，包括：从同一图像数据集中，获取深度模型的多个第一训练样本；根据所述第一训练样本的第i‑1轮扰动，以及第i‑1轮迭代训练时损失函数对应的梯度，计算所述第一训练样本的第i轮扰动，所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上，训练时每个所述第一训练样本中的一部分像素采用错误分类标签，另一部分像素采用正确分类标签；根据分别为所述多个第一训练样本计算出的第i轮扰动，确定该同一图像数据集的通用扰动；根据分别为多个不同图像数据集确定的通用扰动，确定统一的通用扰动；根据所述多个不同图像数据集中的样本，以及所述统一的通用扰动，生成所述深度模型的第二训练样本。

【技术特征摘要】
1.一种训练样本生成方法，其特征在于，包括：从同一图像数据集中，获取深度模型的多个第一训练样本；根据所述第一训练样本的第i-1轮扰动，以及第i-1轮迭代训练时损失函数对应的梯度，计算所述第一训练样本的第i轮扰动，所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上，训练时每个所述第一训练样本中的一部分像素采用错误分类标签，另一部分像素采用正确分类标签；根据分别为所述多个第一训练样本计算出的第i轮扰动，确定该同一图像数据集的通用扰动；根据分别为多个不同图像数据集确定的通用扰动，确定统一的通用扰动；根据所述多个不同图像数据集中的样本，以及所述统一的通用扰动，生成所述深度模型的第二训练样本。2.如权利要求1所述的方法，其特征在于，在所述生成所述深度模型的第二训练样本后，所述方法还包括：利用所述第二训练样本，以及所述多个不同图像数据集中的样本，训练所述深度模型。3.如权利要求1所述的方法，其特征在于，所述根据分别为多个不同图像数据集确定的通用扰动，确定统一的通用扰动，具体包括：获取分别为多个不同图像数据集确定的通用扰动；对获取的各所述通用扰动进行归一化处理；根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子，确定统一的通用扰动。4.如权利要求1所述的方法，其特征在于，所述计算所述第一训练样本的第i轮扰动，具体包括：利用快速梯度算法，计算所述第一训练样本的第i轮扰动；其中，所述计算过程中使用了以下至少一种因子：输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。5.如权利要求4所述的方法，其特征在于，所述计算过程中还使用了指定的随机扰动及其相关控制因子。6.如权利要求1所述的方法，其特征在于，所述确定该同一图像数据集的通用扰动，具体包括：采用以下公式，确定该同一图像数据集的通用扰动：其中，rD表示该同一图像数据集的通用扰动，wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重，rin表示该第n个样本的第i轮扰动。7.如权利要求3所述的方法，其特征在于，所述确定统一的通用扰动，具体包括：采用以下公式，确定统一的通用扰动：其中，R表示所述统一的通用扰动，M表示所述多个不同图像数据集的数量，表示所述多个不同图像数据集中第j个图像数据集的通用扰动，γ表示所述扰动幅度限制因子，rrandom表示指定的随机扰动，该随机扰动服从均值为0且标准差为1的正态分布。8.一种训练样本生成装置，其特征在...

【专利技术属性】
技术研发人员：高三元，徐晓刚，
申请(专利权)人：宽凳北京科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人