一种攻击检测方法及装置制造方法及图纸

技术编号：36682062 阅读：17 留言：0更新日期：2023-02-27 19:40

本申请公开了一种攻击检测方法及装置，涉及AI领域，解决了静态防御方法对应用模型进行重构，导致应用模型处理样本的精度降低的问题。该攻击检测方法包括：首先，攻击检测模型获取推理请求，该推理请求携带有应用模型的待处理数据集，待处理数据集包括一个或多个样本。其次，攻击检测模型检测待处理数据集中是否存在物理对抗样本。最后，若待处理数据集中存在物理对抗样本，攻击检测模型对应用模型执行防护处理。本实施例采用不同于应用模型的攻击检测模型来检测推理请求中是否具有物理对抗样本，由于应用模型无需抵抗物理对抗攻击，因此无需对应用模型进行模型重训练或防御性蒸馏等，避免了对应用模型进行重构导致应用模型的精度降低。精度降低。精度降低。

全部详细技术资料下载

【技术实现步骤摘要】
一种攻击检测方法及装置
[0001]本申请要求于2021年8月20日提交国家知识产权局、申请号为202110959827.5、申请名称为“攻击检测的方法、装置和系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

[0002]本申请涉及人工智能(artificial intelligence，AI)领域，尤其涉及一种攻击检测方法及装置。

技术介绍

[0003]深度神经网络(Deep Neural Network，DNN)广泛应用于计算机视觉(Computer Vision，CV)、语音识别、自然语言处理(Natural Language Processing，NLP)等领域。在基于DNN的应用模型的使用过程中，攻击者为窃取应用模型的参数配置或数据等，采用数字对抗攻击或物理对抗攻击的方式来对该应用模型展开攻击。在数字对抗攻击中，攻击者可控制位(bit)级的数据来攻击应用模型；在物理对抗攻击中，攻击者基于真实的物理世界中构造物理对抗样本(adversarial example)对该应用模型展开攻击。
[0004]以检测物理对抗攻击为例，应用模型采用模型相关的静态防御方法来检测物理对抗攻击，如该静态防御方法为模型重训练方法或防御性蒸馏。而静态防御方法依赖于对应用模型进行重构，导致应用模型处理样本的精度降低。因此，如何检测物理对抗攻击成为目前亟需解决的问题。

技术实现思路

[0005]本申请提供一种攻击检测方法及装置，解决了静态防御方法对应用模型进行重构，导致应用模型处理样本的精度...

【技术保护点】

【技术特征摘要】
1.一种攻击检测方法，其特征在于，所述方法包括：攻击检测模型获取推理请求，所述推理请求携带有应用模型的待处理数据集，所述待处理数据集包括一个或多个样本；所述攻击检测模型检测所述待处理数据集中是否存在物理对抗样本；若所述待处理数据集中存在物理对抗样本，所述攻击检测模型对所述应用模型执行防护处理。2.根据权利要求1所述的方法，其特征在于，所述攻击检测模型是依据训练数据集确定的，所述训练数据集包括针对所述应用模型的多个物理对抗样本和多个标准样本。3.根据权利要求1或2所述的方法，其特征在于，所述攻击检测模型检测所述待处理数据集中是否存在物理对抗样本，包括：对于所述待处理数据集包括的每一个样本，所述攻击检测模型输出所述样本的安全信息；所述安全信息用于指示所述样本包含物理对抗扰动的置信度；若所述样本的置信度达到第一阈值，所述攻击检测模型将所述样本识别为针对所述应用模型的物理对抗样本。4.根据权利要求3所述的方法，其特征在于，所述样本的安全信息是由所述攻击检测模型包含的特征检测模块获取的。5.根据权利要求3或4所述的方法，其特征在于，所述攻击检测模型检测所述待处理数据集中是否存在物理对抗样本，还包括：所述攻击检测模型依据所述待处理数据集包括的多个样本的安全信息，输出所述待处理数据集的检测结果。6.根据权利要求5所述的方法，其特征在于，所述攻击检测模型依据所述待处理数据集包括的多个样本的安全信息，输出所述待处理数据集的检测结果，包括：所述攻击检测模型将所述物理对抗样本存储在所述攻击检测模型包含的序列检测模块中；若所述多个样本中物理对抗样本的数量大于或等于第一数量，所述序列检测模块确定所述推理请求为攻击请求。7.根据权利要求1
‑
6中任一项所述的方法，其特征在于，所述攻击检测模型对所述应用模型执行防护处理，包括：所述攻击检测模型阻断所述应用模型处理所述推理请求。8.根据权利要求7所述的方法，其特征在于，所述攻击检测模型阻断所述应用模型处理所述推理请求，包括：所述攻击检测模型将所述应用模型输出的处理结果设置为无效结果。9.根据权利要求7所述的方法，其特征在于，所述攻击检测模型阻断所述应用模型处理所述推理请求，包括：所述攻击检测模型丢弃所述推理请求。10.根据权利要求1
‑
6中任一项所述的方法，其特征在于，所述方法还包括：所述攻击检测模型记录告警日志，所述告警日志用于指示所述推理请求包括物理对抗样本。
11.一种攻击检测装置，其特征在于，所述攻击检测装置应用于攻击检测模型，所述攻击检测装置包括：通信单元，用于获取推理请求，所述推理请求携带有应用模型的待处理数据集，所述待处理数...

【专利技术属性】
技术研发人员：唐文，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人