一种基于公平的鲁棒神经网络的图像分类方法技术

技术编号：37517951 阅读：12 留言：0更新日期：2023-05-12 15:39

本发明专利技术公布了一种基于公平的鲁棒神经网络的图像分类方法，属于人工智能中的机器学习技术领域。本发明专利技术针对分类任务中的每个类别，对其对抗训练强度进行分类校准，采用本发明专利技术提出的基于公平的鲁棒神经网络的图像分类方法，使得分类模型在最差类别的鲁棒性能够明显优于现有的鲁棒分类方法，从而在安全攸关领域的图像分类任务中具有更高可信性与安全性。以汽车自动驾驶中的路标分类任务为例，使用本发明专利技术进行对抗训练后，分类器能够大幅提升在较难分类类别的路标的鲁棒性，从而提升自动驾驶的安全性。全性。全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于公平的鲁棒神经网络的图像分类方法

[0001]本专利技术属于人工智能中的机器学习
，涉及机器学习图像处理的对抗鲁棒性与安全性。具体为一种基于神经网络对抗训练的图像分类方法，具有高鲁棒性和类别间公平性等特点。

技术介绍

[0002]基于神经网络的机器学习方法在图像分类任务中取得了很大优势，并广泛应用于自动驾驶、智能诊疗等领域。通过将带有类别标签的若干样本作为训练集输入到神经网络中进行训练，可以在测试集中获得令人满意的分类效果。然而，研究发现，经过常规机器学习训练后的神经网络模型普遍存在对抗样本问题。对抗样本是在原输入样本上添加微小扰动，导致模型分类错误的一类样本。对于一个属于类别y的样本x和一个分类预测模型f
θ
，如果模型可以在没有扰动的情况下正确分类x，即argmax
k
f
θ
(x)
k
＝y，但添加微小扰动δ后导致误分类，即argmax
k
f
θ
(x+δ)
k
≠y，则x+δ称为对抗样本，其中f
θ
(x)
k
为模型f
θ
对样本x在第k个类的预测概率。
[0003]对抗样本的发现揭示了人工智能安全方面的极大隐患，使攻击者可以通过在输入样本中添加扰动的方法实现对抗攻击，从而对机器学习模型的性能造成干扰。例如，攻击者在交通路标中添加特定的对抗干扰图样，就可以使自动驾驶汽车搭载的路标分类器在行驶过程中错误判断路标类别，从而对交通...

【技术保护点】

【技术特征摘要】
1.一种基于公平的鲁棒神经网络的图像分类方法，包括如下步骤：1)收集分类任务的数据集D，设分类任务共有K个类别，则需要从每个类别y∈{1，2，
…
，K}中收集同样多的样本，组成若干个样本
‑
标签对(x，y)，收入数据集D中；2)将训练集D划分为训练集D
train
和验证集D
valid
，初始化一个神经网络f
θ
，其中θ为网络参数，随机初始化一组神经网络参数其网络结构与f
θ
相同，用于维护模型参数平均，设置鲁棒公平性阈值γ，设一共训练模型N轮；3)在第T∈{1，2，
…
，N}轮训练中，每轮训练依次包括如下步骤：3
‑
1)对于k∈{1，2，
…
，K}，假设模型在上一轮的训练迭代中第k类样本的训练准确率为t
k
，则在此轮训练迭代中，对此类别采取∈
k
←
(λ1+t
k
)
·
∈的扰动半径，其中λ1为设定的超参数，预先设定扰动半径为∈，较困难的类的训练准确率t
k
较小，使得本轮使用的扰动半径∈
k
相应减小，以降低在对抗训练过程中此类样本上的扰动强度；反之亦然；3
‑
2)根据步骤3
‑
1)得到的每个类别的扰动半径∈
k
，在训练集D
train
上进行随机梯度下降对对抗训练，对每组小批量样本的{(x
n
，y
n
)}，在扰动范围内寻找关于当前模型f
θ
对于x
n
的对抗样本，即求解优化问题max
δ∈...

【专利技术属性】
技术研发人员：王奕森，魏泽明，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人