检测对抗攻击的方法和装置制造方法及图纸

技术编号：36577246 阅读：13 留言：0更新日期：2023-02-04 17:35

本申请涉及人工智能领域，提供了一种检测对抗攻击的方法和装置，利用分类结果判定输入样本是否为对抗样本，从而避免对抗攻击，保证分类结果的准确性。该方法包括：获取分类模型的输入样本、输入样本对应的第一分类结果和分类模型的多种分类标签；根据输入样本和多种分类标签生成多个恢复样本，多种分类标签中的每种分类标签与多个恢复样本中的每个恢复样本一一对应；获取多个恢复样本中每个恢复样本与输入样本的距离，与所述输入样本距离最小的恢复样本为第一恢复样本；根据第一恢复样本对应的分类标签和第一分类结果判断输入样本为对抗样本或非对抗样本。抗样本或非对抗样本。抗样本或非对抗样本。

全部详细技术资料下载

【技术实现步骤摘要】
检测对抗攻击的方法和装置

[0001]本申请涉及人工智能领域，并且更具体地，涉及一种检测对抗攻击的方法和装置。

技术介绍

[0002]深度学习技术在图像识别、自然语言处理、语音处理等领域得到广泛应用，成为自动驾驶、安保监控等视觉领域的主力，然而人工智能系统在面临对抗样本的攻击时存在巨大的安全隐患。对抗样本攻击是指通过对输入的样本(图像等)添加扰动，通常这样的扰动很小而无法被人类察觉，但会导致神经网络模型错误识别和分类，为深度学习的实践造成巨大威胁，例如图1中的(a)图被神经网络模型识别为“大熊猫”，同时置信度为57.7％，在加上(b)图中的一定噪声后得到(c)图，在人类肉眼看来，(c)图和(a)图并没有什么区别，但是神经网络模型则会将(c)图识别为“长臂猿”，且置信度高达99.3％。在实际应用场景中，对抗样本攻击可能带来安全问题，例如在人脸识别中，攻击者可以使用对抗样本绕开验证，从而获得本来无法获得的权限；在无人驾驶系统中，攻击者可以对自动驾驶的车辆前方的图像进行对抗样本攻击，使得无人驾驶系统对于交通指示标志等信息获取有误，从而造成无人驾驶系统失效等灾难性后果。

技术实现思路

[0003]本申请提供一种检测对抗攻击的方法和装置，利用分类结果判定输入样本是否为对抗样本，从而避免对抗攻击，保证分类结果的准确性。
[0004]第一方面，提供了一种检测对抗攻击的方法，包括：获取分类模型的输入样本、输入样本对应的第一分类结果和分类模型的多种分类标签；根据输入样本和多种分类标签生成多个恢复样本，多种分类标...

【技术保护点】

【技术特征摘要】
1.一种检测对抗攻击的方法，其特征在于，包括：获取分类模型的输入样本、所述输入样本对应的第一分类结果和所述分类模型的多种分类标签；根据所述输入样本和所述多种分类标签生成多个恢复样本，所述多种分类标签中的每种分类标签与所述多个恢复样本中的每个恢复样本一一对应；获取所述多个恢复样本中每个恢复样本与所述输入样本的距离，与所述输入样本距离最小的恢复样本为第一恢复样本；根据所述第一恢复样本对应的分类标签和所述第一分类结果判断所述输入样本为对抗样本或非对抗样本。2.根据权利要求1所述的方法，其特征在于，所述根据所述输入样本和所述多种分类标签生成多个恢复样本之前，所述方法还包括：根据所述输入样本和所述第一分类结果生成所述第一分类结果的第二恢复样本；计算所述输入样本与所述第二恢复样本的距离；判断所述输入样本与所述第二恢复样本的距离小于第一阈值。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：当所述输入样本与所述第二恢复样本的距离大于或等于第一阈值时，判断所述输入样本为对抗样本。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述输入样本和所述多种分类标签生成多个恢复样本，包括：将所述输入样本和所述多种分类标签中的每种分类标签输入条件编码器，以得到潜空间向量；将所述潜空间向量和所述多种分类标签中的每种分类标签输入条件解码器，以得到多个恢复样本，所述多种分类标签中的每种分类标签与所述多个恢复样本中的每个恢复样本一一对应。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据所述第一恢复样本对应的分类标签和所述第一分类结果判定所述输入样本为对抗样本或非对抗样本，包括：所述第一恢复样本对应的分类标签和所述第一分类结果相同，则所述输入样本为非对抗样本；所述第一恢复样本对应的分类标签和所述第一分类结果不相同，则所述输入样本为对抗样本。6.根据权利要求1至5中任一项所述的方法，其特征在于，所述输入样本为对抗样本时，所述方法还包括：判断所述第一恢复样本与所述输入样本的距离小于第二阈值；将所述第一恢复样本对应的分类标签作为所述输入样本的正确分类结果。7.一种检测对抗攻击的装置，其特征在于，包括：获取单元，获取分类模型的输入样本、所述输入样本对应的第一分类结果和所述分类模型的多种分类标签；处理单元，用于根据所述输入样本和所述多种分类标签生成多个恢复样本，所述多种分类标签中的每种分类标签与所述多个恢复样本中的每...

【专利技术属性】
技术研发人员：艾超，吴瑾，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人