一种生成对抗样本的方法及系统技术方案

技术编号：31512712 阅读：13 留言：0更新日期：2021-12-22 23:53

本说明书涉及人工智能领域，特别涉及一种生成对抗样本的方法及系统。该方法包括：基于初始样本和目标模型的多个替代模型，进行一轮或多轮迭代，以构造对抗样本；其中的一轮迭代包括：获取当前轮的待调整样本；当当前轮为第一轮迭代时，所述待调整样本为所述初始样本，否则为前一轮的对抗样本；基于待调整样本和多个替代模型，确定各替代模型的脆弱方向；所述脆弱方向与替代模型对待调整样本的预测结果与所述初始样本的标签之间的差异相对待调整样本的梯度信息相关；基于各替代模型的脆弱方向确定扰动数据；将所述扰动数据添加到所述待调整样本中，以获得当前轮的对抗样本。以获得当前轮的对抗样本。以获得当前轮的对抗样本。

全部详细技术资料下载

【技术实现步骤摘要】
一种生成对抗样本的方法及系统

[0001]本说明书涉及人工智能领域，特别涉及一种生成对抗样本的方法及系统。

技术介绍

[0002]对抗攻击是人工智能领域热门的主题之一，以机器视觉为例，对抗攻击指对于一张照片的分类的任务，添加上攻击者特制的微小的噪声，在并不影响人类对其正确的判断情况下，但却会误导被攻击模型给出与正确结果不同或截然相反的答案。在许多需要高可靠性的场景下，如自动驾驶系统、生物特征身份验证等领域，对抗攻击会带来较高的威胁。
[0003]因此，需要一种能够生成对抗样本的方法，以通过该对抗样本测试或优化模型，增强其抵御对抗攻击的能力。

技术实现思路

[0004]本说明书实施例之一提供一种生成对抗样本的方法，其包括：基于初始样本和目标模型的多个替代模型，进行一轮或多轮迭代，以构造对抗样本；其中的一轮迭代包括：获取当前轮的待调整样本；当当前轮为第一轮迭代时，所述待调整样本为所述初始样本，否则为前一轮的对抗样本；基于待调整样本和多个替代模型，确定各替代模型的脆弱方向；所述脆弱方向与替代模型对待调整样本的预测结果与所述初始样本的标签之间的差异相对待调整样本的梯度信息相关；基于各替代模型的脆弱方向确定扰动数据；将所述扰动数据添加到所述待调整样本中，以获得当前轮的对抗样本。
[0005]本说明书实施例之一提供一种生成对抗样本的系统，用于基于初始样本和目标模型的多个替代模型，进行一轮或多轮迭代，以构造对抗样本；其包括获取模块、脆弱方向确定模块、扰动数据确定模块以及生成模块；在其中的一轮迭代中：...

【技术保护点】

【技术特征摘要】
1.一种生成对抗样本的方法，其包括：基于初始样本和目标模型的多个替代模型，进行一轮或多轮迭代，以构造对抗样本；其中的一轮迭代包括：获取当前轮的待调整样本；当当前轮为第一轮迭代时，所述待调整样本为所述初始样本，否则为前一轮的对抗样本；基于待调整样本和多个替代模型，确定各替代模型的脆弱方向；所述脆弱方向与替代模型对待调整样本的预测结果与所述初始样本的标签之间的差异相对待调整样本的梯度信息相关；基于各替代模型的脆弱方向确定扰动数据；将所述扰动数据添加到所述待调整样本中，以获得当前轮的对抗样本。2.如权利要求1所述的方法，所述替代模型与目标模型的任务类型相同。3.如权利要求2所述的方法，其中：所述替代模型中的至少部分模型结构与所述目标模型相同；和/或，所述替代模型用于处理的样本类型与所述目标模型相同；所述样本类型为文本数据、音频数据或图像数据。4.如权利要求1所述的方法，所述基于待调整样本和多个替代模型，确定各替代模型的脆弱方向，包括对于任一替代模型：将所述待调整样本输入至所述替代模型，以获取所述替代模型对所述待调整样本的预测结果与所述标签之间的差异相对待调整样本的梯度信息；将所述梯度信息作为该替代模型的脆弱方向。5.如权利要求1所述的方法，所述基于待调整样本和多个替代模型，确定各替代模型的脆弱方向，包括对于任一替代模型：将所述待调整样本输入至所述替代模型，以获取所述替代模型对所述待调整样本的预测结果与所述标签之间的差异相对待调整样本的梯度信息；基于所述梯度信息以及所述待调整样本获得初始对抗样本；将所述初始对抗样本输入至所述替代模型，以获取所述替代模型对所述初始对抗样本的预测结果与所述标签之间的差异相对初始对抗样本的梯度信息；将所述替代模型对所述初始对抗样本的预测结果与所述标签之间的差异相对...

【专利技术属性】
技术研发人员：范洺源，陈岑，王力，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人