通过使用局部线性度正则化训练更安全的神经网络制造技术

技术编号：31565240 阅读：11 留言：0更新日期：2021-12-25 10:59

用于训练神经网络的方法、系统和装置，包括在计算机存储介质上编码的计算机程序。方法中的一种包括：使用神经网络并根据网络参数的当前值处理每个训练输入以为训练输入生成网络输出；通过评估损失函数计算每个训练输入的相应损失；从多个可能的扰动中识别最大非线性扰动；以及通过执行神经网络训练过程的迭代来确定对神经网络参数的当前值的更新，以减少训练输入的相应损失并减少所识别的最大非线性扰动的损失函数的非线性度。扰动的损失函数的非线性度。扰动的损失函数的非线性度。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】通过使用局部线性度正则化训练更安全的神经网络

[0001]本说明书涉及训练安全的、即对恶意行为者的攻击鲁棒的神经网络。

技术介绍

[0002]神经网络是机器学习模型，它采用非线性单元的一层或多层来预测所接收到的输入的输出。除了输出层之外，一些神经网络包括一个或多个隐藏层。每个隐藏层的输出被用作对于在网络中下一层(即，下一个隐藏层或输出层)的输入。网络的每一层根据相应参数集的当前值从所接收到的输入生成输出。

技术实现思路

[0003]本说明书描述了一种系统，该系统实现为在一个或多个位置的一个或多个计算机上的计算机程序，该系统训练神经网络以抵抗对抗性攻击。
[0004]根据一方面，提供了一种训练具有多个网络参数的神经网络的方法，以特别是提供更安全的神经网络(一种增加神经网络的安全性的方法)。该方法可以包括获得多个训练输入，并且对于多个训练输入中的每一个，获得该训练输入的相应目标输出。该方法可以进一步包括在多个训练输入中的每一个上训练神经网络。该训练可以包括使用神经网络并根据网络参数的当前值处理训练输入中的每一个以为训练输入中的每一个生成相应的网络输出。该训练可以进一步包括通过评估损失函数来计算每个训练输入的相应损失。损失函数可以测量以下两者之间的差：(i)神经网络通过处理输入
‑
输出对中的输入生成的输出和(ii)输入
‑
输出对中的输出。计算训练输入中每一个的损失可以包括评估在输入
‑
输出对处的损失函数，该输入
‑
输出对包括训练...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种训练具有多个网络参数的更安全的神经网络的方法，所述方法包括：获得多个训练输入，并且对于所述多个训练输入中的每一个，获得所述训练输入的相应目标输出；以及在所述多个训练输入中的每一个上训练所述神经网络，包括：使用所述神经网络并根据所述网络参数的当前值处理所述训练输入中的每一个以为所述训练输入中的每一个生成相应网络输出；通过评估损失函数来计算所述训练输入中的每一个的相应损失，其中，所述损失函数测量以下两者之间的差：(i)由所述神经网络通过处理输入
‑
输出对中的输入生成的输出和(ii)在所述输入
‑
输出对中的输出，并且其中，计算所述训练输入中的每一个的所述损失包括评估在所述输入
‑
输出对处的所述损失函数，所述输入
‑
输出对包括所述训练输入和用于所述训练输入的所述目标输出；从多个可能的扰动中识别最大非线性扰动，其中，所述最大非线性扰动是以下扰动，对于所述扰动，所述损失函数当在输入
‑
输出对处被评估时是最非线性的，该输入
‑
输出对包括(i)通过将所述可能的扰动应用于给定的训练输入而生成的扰动训练输入和(ii)用于所述给定训练输入的目标输出；以及通过执行神经网络训练过程的迭代来确定对所述神经网络的所述参数的所述当前值的更新，以减少所述训练输入的所述相应损失并减少所识别的最大非线性扰动的所述损失函数的所述非线性度。2.根据任一前述权利要求所述的方法，其中，所述训练输入是图像。3.根据任一前述权利要求所述的方法，其中，识别所述最大非线性扰动包括：初始化扰动；对于一个或多个迭代中的每一个：对于所述训练输入中的每一个，通过将所述扰动应用于所述训练输入来生成相应的扰动的训练输入；对于所述训练输入中的每一个，使用所述神经网络并根据所述网络参数的所述当前值处理所述扰动的训练输入，以为所述扰动的训练输入生成网络输出；对于所述训练输入中的每一个，使用用于所述扰动的训练输入的所述网络输出，确定局部线性度度量相对于所述扰动并在所述训练输入的所述扰动的输入处评估的梯度，其中，所述局部线性度度量测量所述损失函数当在输入
‑
输出对处被评估时的非线性程度，该输入
‑
输出对包括(i)所述扰动的训练输入和(ii)用于所述训练输入的所述目标输出；通过对所述训练输入的所述梯度求平均来生成所述局部线性度度量的平均的梯度；以及使用所述平均的梯度更新所述扰动；以及选择在所述一次或多次迭代的最后一次迭代之后的扰动作为所述最大非线性扰动。4.根据权利要求3所述的方法，其中，所述局部线性度度量是以下两者之间的绝对差：(1)在输入
‑

【专利技术属性】
技术研发人员：秦翀立，斯文，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人