神经网络后门攻击的检测方法、装置和电子设备制造方法及图纸

技术编号：24411893 阅读：36 留言：0更新日期：2020-06-06 09:35

本说明书实施例提出了一种神经网络后门攻击的检测方法、装置和电子设备，其中，上述神经网络后门攻击的检测方法中，在获取训练数据之后，利用上述训练数据对神经网络进行训练，获得训练好的神经网络模型，然后获取上述训练数据中第一标签类别对应的训练数据，将第一标签类别对应的训练数据输入到训练好的神经网络模型中，获得上述神经网络模型的隐层数据；然后，将上述隐层数据进行聚类，根据聚类结果对神经网络后门攻击进行检测。

Detection method, device and electronic equipment of back door attack based on Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
神经网络后门攻击的检测方法、装置和电子设备
本说明书实施例涉及人工智能
，尤其涉及一种神经网络后门攻击的检测方法、装置和电子设备。
技术介绍
随着人工智能的发展，神经网络模型已经广泛应用到各行各业，在各个场景发挥着非常重要的作用。在训练神经网络模型时，训练数据可能来源于不同的设备和/或不同的数据提供方，因此训练数据中极易被加入特定的“后门”，从而导致最后生成的模型存在“后门”，神经网络模型的识别准确性大大降低，这种现象被称之为“数据投毒”（datapoison）。因此需要提供一种检测训练数据和神经网络模型是否存在后门的方法。
技术实现思路
本说明书实施例提供了一种神经网络后门攻击的检测方法、装置和电子设备，以实现对神经网络模型是否受到后门攻击进行检测，提高神经网络模型的识别准确性。第一方面，本说明书实施例提供一种神经网络后门攻击的检测方法，包括：获取训练数据；利用所述训练数据对神经网络进行训练，获得训练好的神经网络模型；获取所述训练数据中第一标签类别对应的训练数据；将所述第一标签类别对应的训练数据输入到所述训练好的神经网络模型中，获得所述神经网络模型的隐层数据；将所述隐层数据进行聚类，根据聚类结果对神经网络后门攻击进行检测。上述神经网络后门攻击的检测方法中，在获取训练数据之后，利用上述训练数据对神经网络进行训练，获得训练好的神经网络模型，然后获取上述训练数据中第一标签类别对应的训练数据，将第一标签类别对应的训练数据输入到训练好的...

【技术保护点】
1.一种神经网络后门攻击的检测方法，包括：/n获取训练数据；/n利用所述训练数据对神经网络进行训练，获得训练好的神经网络模型；/n获取所述训练数据中第一标签类别对应的训练数据；/n将所述第一标签类别对应的训练数据输入到所述训练好的神经网络模型中，获得所述神经网络模型的隐层数据；/n将所述隐层数据进行聚类，根据聚类结果对神经网络后门攻击进行检测。/n

【技术特征摘要】
1.一种神经网络后门攻击的检测方法，包括：
获取训练数据；
利用所述训练数据对神经网络进行训练，获得训练好的神经网络模型；
获取所述训练数据中第一标签类别对应的训练数据；
将所述第一标签类别对应的训练数据输入到所述训练好的神经网络模型中，获得所述神经网络模型的隐层数据；
将所述隐层数据进行聚类，根据聚类结果对神经网络后门攻击进行检测。

2.根据权利要求1所述的方法，其中，所述将所述隐层数据进行聚类包括：
将所述隐层数据聚为两类，分别为第一类别和第二类别。

3.根据权利要求2所述的方法，其中，所述根据聚类结果对神经网络后门攻击进行检测包括：
根据所述第一类别和所述第二类别分别包括的隐层数据的数量，对神经网络后门攻击进行检测。

4.根据权利要求3所述的方法，其中，所述根据所述第一类别和所述第二类别分别包括的隐层数据的数量，对神经网络后门攻击进行检测包括：
将所述第一类别中包括的隐层数据的第一数量与所述第二类别中包括的隐层数据的第二数量进行比较；
计算所述第一数量与所述第二数量中的较小值与较大值的比值；
如果所述比值小于预定阈值，则获取所述较小值对应类别中的隐层数据；
判断所述隐层数据对应的训练数据与所述训练数据的标签类别是否相符；
如果不相符，则确定所述神经网络模型存在后门攻击。

5.根据权利要求1-4任意一项所述的方法，其中，所述将所述隐层数据进行聚类包括：
通过K均值聚类算法，将所述隐层数据进行聚类。

6.一种神经网络后门攻击的检测装置，包括：
获取模块，用于获取训练数据；
训练模块，用于利用所述获取模块获取的训练数据对神经网络进行训练，获得训练好的神经网络模型；
所述获取模块，还用于获取所述训练数据中第一标签类别对应的训练数据；以及将所述第一标签类别...

【专利技术属性】
技术研发人员：林建滨，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人