一种对抗攻击的监测方法和装置制造方法及图纸

技术编号：23891227 阅读：21 留言：0更新日期：2020-04-22 06:33

说明书披露一种对抗攻击的监测方法和装置。所述方法包括：获取目标模型的对抗样本空间；采集调用所述目标模型的输入数据；判断所述输入数据是否落入所述对抗样本空间；根据判断结果计算监测周期内落入到所述对抗样本空间的输入数据的监测参数，当所述监测参数满足预设的攻击条件时，确定监测到面向所述目标模型的对抗攻击。上述方案可有效监测对抗攻击，有效降低隐私泄露、资金损失等安全风险，保证数据安全。

A monitoring method and device against attack

全部详细技术资料下载

【技术实现步骤摘要】
一种对抗攻击的监测方法和装置
本说明书涉及人工智能领域，尤其涉及一种对抗攻击的监测方法及装置。
技术介绍
随着人工智能的不断发展，机器学习模型越来越复杂，精确度越来越高。然而精确度越高的模型，鲁棒性却可能越差，即模型的稳健性越差，这就给攻击制造了机会。以对抗攻击为例，攻击者对样本进行细微的修改形成对抗样本，并输入模型，以使模型输出错误的预测结果。对抗攻击可能会带来安全风险，例如，对于依靠人脸识别进行身份认证的场景，攻击者构造了一对抗样本并输入人脸识别模型，若模型将该对抗样本识别为某合法用户，攻击者就能够通过身份认证，带来私有数据泄露、资金损失等安全风险。
技术实现思路
有鉴于此，本说明书提供一种对抗攻击的监测方法和装置。具体地，本说明书是通过如下技术方案实现的：一种对抗攻击的监测方法，包括：获取目标模型的对抗样本空间；采集调用所述目标模型的输入数据；判断所述输入数据是否落入所述对抗样本空间；根据判断结果计算监测周期内落入到所述对抗样本空间的输入数据的监测参数，当所述监测参数满足预设的攻击条件时，确定监测到面向所述目标模型的对抗攻击。一种对抗攻击的监测装置，包括：获取单元，获取目标模型的对抗样本空间；采集单元，采集调用所述目标模型的输入数据；判断单元，判断所述输入数据是否落入所述对抗样本空间；监测单元，根据判断结果计算监测周期内落入到所述对抗样本空间的输入数据的监测参数，当所述监测参数满足预设的攻击条件时...

【技术保护点】
1.一种对抗攻击的监测方法，包括：/n获取目标模型的对抗样本空间；/n采集调用所述目标模型的输入数据；/n判断所述输入数据是否落入所述对抗样本空间；/n根据判断结果计算监测周期内落入到所述对抗样本空间的输入数据的监测参数，当所述监测参数满足预设的攻击条件时，确定监测到面向所述目标模型的对抗攻击。/n

【技术特征摘要】
1.一种对抗攻击的监测方法，包括：
获取目标模型的对抗样本空间；
采集调用所述目标模型的输入数据；
判断所述输入数据是否落入所述对抗样本空间；
根据判断结果计算监测周期内落入到所述对抗样本空间的输入数据的监测参数，当所述监测参数满足预设的攻击条件时，确定监测到面向所述目标模型的对抗攻击。

2.根据权利要求1所述方法，所述目标模型的对抗样本空间的确定方式，包括：
对所述目标模型进行攻击测试，以获得所述目标模型的至少一个对抗样本；
基于所述对抗样本，确定所述目标模型的对抗样本空间。

3.根据权利要求2所述方法，所述攻击测试，包括：
基于边界攻击的黑盒测试；或
基于边界攻击的白盒测试。

4.根据权利要求2所述方法，所述基于所述对抗样本，确定所述目标模型的对抗样本空间，包括：
确定每个对抗样本的空间坐标；
基于所述空间坐标对所述对抗样本进行聚类，得到若干对抗样本簇；
为每个对抗样本簇生成对应的凸包络，作为所述对抗样本空间。

5.根据权利要求4所述方法，所述判断所述输入数据是否落入所述对抗样本空间，包括：
确定所述输入数据的空间坐标；
判断所述空间坐标是否落入任意凸包络；
若是，则确定所述输入数据落入所述对抗样本空间。

6.根据权利要求4所述方法，所述判断所述输入数据是否落入所述对抗样本空间，包括：
确定所述输入数据的空间坐标；
根据所述空间坐标，判断所述输入数据与任意对抗样本簇的距离是否小于距离阈值；
若是，则确定所述输入数据落入所述对抗样本空间。

7.根据权利要求1所述方法，所述监测参数为落入所述对抗样本空间的输入数据的数量，所述攻击条件为所述数量达到数量阈值。

8.根据权利要求1所述方法，所述监测参数为落入所述对抗样本空间的输入数据的比例，所述攻击条件为所述比例达到比例阈值。

9.根据权利要求1所述方法，所述确定监测到面向所述目标模型的对抗攻击后，所述方法还包括：
发送告警信息。

10.一种对抗攻击的监测装置，包括：
获取单元，获取目标模型的对抗样本空间；
采集单元，采集调用所述目标模型的输入数据；
判断单元，判断所述输入数据是否落入所述对抗样本空间；
监测单元，根...

【专利技术属性】
技术研发人员：宗志远，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人