【技术实现步骤摘要】
对抗样本的生成方法和装置
[0001]本公开涉及人工智能中的图像处理、目标检测及深度学习,尤其涉及一种对抗样本的生成方法和装置。
技术介绍
[0002]为了测试目标检测算法在人工智能(Artificial Intelligence,AI)安全领域内的有效性,可以通过对样本图像进行干扰生成对抗样本的方式实现。
[0003]在相关技术中,可以由人为的方式在样本图像中添加干扰信息,以生成对抗样本。
[0004]然而,采用上述方式,存在生成对抗样本的准确性偏低的技术问题。
技术实现思路
[0005]本公开提供了一种用于提高生成对抗样本的准确性的对抗样本的生成方法和装置。
[0006]根据本公开的第一方面,提供了一种对抗样本的生成方法,包括:
[0007]获取原始图像、以及根据所述原始图像生成的初始的对抗样本;
[0008]对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测,得到检测信息;
[0009]根据所述检测信息、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数,并基于所述目标对象的损失函数对所述初始的对抗样本进行调整,得到最终的对抗样本。
[0010]根据本公开的第二方面,提供了一种对抗样本的生成装置,包括:
[0011]第一获取单元,用于获取原始图像、以及根据所述原始图像生成的初始的对抗样本;
[0012]检测单元,用于对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测,得到检测信息;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种对抗样本的生成方法,包括:获取原始图像、以及根据所述原始图像生成的初始的对抗样本;对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测,得到检测信息;根据所述检测信息、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数,并基于所述目标对象的损失函数对所述初始的对抗样本进行调整,得到最终的对抗样本。2.根据权利要求1所述的方法,其中,对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测,得到检测信息,包括:对所述原始图像中的目标对象进行目标检测,得到所述目标对象的真实类别;对所述初始的对抗样本中的目标对象进行目标检测,得到所述目标对象在所述真实类别下的置信度、以及所述目标对象在其他类别下的置信度,其中,所述其他类别为所述真实类别之外的类别,所述检测信息包括所述目标对象在所述真实类别下的置信度、以及所述目标对象在其他类别下的置信度。3.根据权利要求2所述的方法,其中,根据所述检测信息、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数,包括:根据所述目标对象在其他类别下的置信度,构建类间差异性损失函数,其中,所述类间差异性损失函数为所述目标对象在其他类别下的置信度之和;根据所述真实类别下的置信度、所述类间差异性损失函数、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数。4.根据权利要求3所述的方法,其中,根据所述目标对象在其他类别下的置信度,构建类间差异性损失函数,包括:从所述目标对象在其他类别下的置信度中,依次获取N个最大的置信度,其中,N为大于1的正整数;根据获取到的N个最大的置信度,构建所述类间差异性损失函数。5.根据权利要求3或4所述的方法,其中,根据所述检测信息、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数,包括:确定所述原始图像与所述初始的对抗样本之间的差异信息;根据所述差异信息和所述检测信息,构建所述目标对象的损失函数。6.根据权利要求5所述的方法,所述方法还包括:确定所述初始的对抗样本的平滑信息,其中,所述平滑信息表征所述初始的对抗样本在相同像素位置且不同类别下的置信度的差异、以及所述初始的对抗样本在相同类别且不同像素位置的置信度的差异;以及,根据所述差异信息和所述检测信息,构建所述目标对象的损失函数,包括:根据所述差异信息、所述目标对象在所述真实类别下的置信度、所述类间差异性损失函数、以及所述平滑信息,构建所述目标对象的损失函数。7.根据权利要求6所述的方法,其中,根据所述差异信息、所述目标对象在所述真实类别下的置信度、所述类间差异性损失函数、以及所述平滑信息,构建所述目标对象的损失函数,包括:计算所述类间差异性损失函数与所述目标对象在所述真实类别下的置信度之间的差
值;计算所述差异信息与所述平滑信息之间的和;根据所述类间差异性损失函数与所述目标对象在所述真实类别下的置信度之间的差值、以及所述差异信息与所述平滑信息之间的和,构建所述目标对象的损失函数。8.根据权利要求1
‑
7任一项所述的方法,其中,对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测,得到检测信息,包括:对所述原始图像中的目标对象进行目标检测,得到所述目标对象的真实类别、以及所述目标对象在各类别下各自对应的置信度;对所述初始的对抗样本中的目标对象进行目标检测,得到所述目标对象在除所述真实类别外的其他类别下的置信度;其中,所述检测信息包括与所述目标对象对应的误判对象在预设类别下的置信度、以及所述目标对象在除所述真实类别外的其他类别下的置信度。9.根据权利要求8所述的方法,其中,根据所述检测信息、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数,包括:根据所述目标对象在各类别下各自对应的置信度,确定所述目标对象在所述真实类别下的置信度;根据所述目标对象在除所述真实类别外的其他类别下的置信度,构建类间差异性损失函数,其中,所述类间差异性损失函数为所述目标对象在其他类别下的置信度之和;根据所述真实类别下的置信度、所述类间差异性损失函数、所述原始图像、以及所述初始的对抗样本,构建所述目标对象的损失函数。10.根据权利要求9所述的方法,其中,根据所述目标对象在各类别下各自对应的置信度,确定所述目标对象在所述真实类别下的置信度,包括:根据所述目标对象在各类别下各自对应的置信度,确定所述目标对象在预设的所述目标对象的误判类别下的置信度;从所述目标对象在各类别下各自对应的置信度中,获取目标置信度,其中,所述目标置信度大于误判类别下的置信度;根据所述目标置信度,确定所述目标对象在所述真实类别下的置信度。11.根据权利要求1
‑
10任一项所述的方法,其中,基于所述目标对象的损失函数对所述初始的对抗样本进行调整,得到最终的对抗样本,包括:调整所述初始的对抗样本,以满足所述目标对象的损失函数小于预设损失阈值,并将满足所述目标对象的损失函数小于所述损失阈值时的调整后的初始的对抗样本,确定为最终的对抗样本。12.根据权利要求1
‑
11任一项所述的方法,在获取根据所述原始图像生成的初始的对抗样本之前,所述方法还包括:获取所述原始图像的初始的扰动区域;根据所述最终的对抗样本应用的目标模型,对所述原始图像中的初始的扰动区域进行替换处理,得到所述初始的对抗样本。13.根据权利要求12所述的方法,其中,根据所述最终的对抗样本应用的目标模型,对所述原始图像中的初始的扰动区域进行替换处理,得到所述初始的对抗样本,包括:
根据所述目标模型对所述初始的扰动区域进行参数初始化处理,得到目标的扰动区域;将所述目标的扰动区域对所述原始图像中的初始的扰动区域进行替换处理,得到所述初始的对抗样本。14.一种对抗样本的生成装置,包括:第一获取单元,用于获取原始图像、以及根据所述原始图像生成的初始的对抗样本;检测单元,用于对所述原始图像和所述初始的对抗样本中的目标对象进行目标检测...
【专利技术属性】
技术研发人员:田伟娟,王洋,吕中厚,黄英仁,张华正,干逸显,高梦晗,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。