神经网络模型的训练方法及装置制造方法及图纸

技术编号：33122138 阅读：10 留言：0更新日期：2022-04-17 00:26

本公开提供一种神经网络模型的训练方法及装置。所述方法包括：获取与所述神经网络模型的攻击防御需求相应的原始数据集；利用所述原始数据集对所述神经网络模型进行预训练，以得到预训练模型；基于协方差矩阵自适应进化策略CMA

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的训练方法及装置

[0001]本公开涉及深度学习领域，尤其涉及一种神经网络模型的训练方法及装置。

技术介绍

[0002]机器学习技术尤其是深度学习，在生活中得到了广泛的应用，包括军事、工业、医疗和互联网等领域。然而，随着机器学习相关技术及系统在全世界各领域的各种基础设施中应用的越来越广泛，有越来越多的恶意人员及机构将相关系统视为目标，试图去攻击他们；机器学习系统被攻击会为应用其的场景带来严重的后果，伴随着机器学习系统的发展和应用，其安全问题也逐渐受到大家的关注。
[0003]如何建立有效的防御机制是确保机器学习系统安全的关键。现有技术中的防御技术有基于木马模式识别的攻击检测防御方法、利用网络梯度信息及生成对抗网络的对抗训练防御方法、基于神经元修复和剪枝的对抗防御方法等。然而，大部分防御技术都是通过可知攻击样本的模式信息，去实现攻击检测或防御模型的构建；对于未知攻击样本的模式信息，并没有有效的办法进行防范。

技术实现思路

[0004]有鉴于此，本公开的目的在于提出一种神经网络模型的训练方法及装置。
[0005]基于上述目的，本公开一个或多个实施例提供了一种神经网络模型的训练方法，包括：获取与所述神经网络模型的攻击防御需求相应的原始数据集；
[0006]利用所述原始数据集对所述神经网络模型进行预训练，以得到预训练模型；
[0007]基于协方差矩阵自适应进化策略CMA
‑
ES，利用训练数据集对所述预训练模型进行补充训练，以得到目标模型。
...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的训练方法，其特征在于，包括：获取与所述神经网络模型的攻击防御需求相应的原始数据集；利用所述原始数据集对所述神经网络模型进行预训练，以得到预训练模型；基于协方差矩阵自适应进化策略CMA
‑
ES，利用训练数据集对所述预训练模型进行补充训练，以得到目标模型。2.根据权利要求1所述的神经网络模型的训练方法，其特征在于，基于协方差矩阵自适应进化策略CMA
‑
ES，利用训练数据集对所述预训练模型进行补充训练，以得到目标模型，包括如下步骤：S41将所述预训练模型的中间层变化建模为多维高斯分布；S42在所述多维高斯分布内采样中间层参数的候选解集合，形成多个候选神经网络模型；S43根据用户选择的训练数据生成方式，基于所述候选神经网络模型的结构和参数信息从所述原始数据集生成训练数据集；S44将所述训练数据集输入所述候选神经网络模型，评估所述候选神经网络模型的鲁棒性；S45按照鲁棒性从高到低进行排序，从鲁棒性最高开始选取预先设定比例的候选神经网络模型作为优选神经网络模型；S46基于所述优选神经网络模型的中间层参数，更新所述多维高斯分布的参数，得到新的多维高斯分布；重复步骤S42至S46，直至满足预先设定的终止条件时，将所述优选神经网络模型作为目标模型。3.根据权利要求2所述的神经网络模型的训练方法，其特征在于，所述预先设定终止条件为：重复迭代的次数阈值、鲁棒性参数阈值或所述鲁棒性参数在迭代过程中不再提升中的至少一个。4.根据权利要求2所述的神经网络模型的训练方法，其特征在于，将所述预训练模型的中间层...

【专利技术属性】
技术研发人员：王玉龙，王东霞，曹梦华，苏森，徐鹏，双锴，张忠宝，程祥，
申请(专利权)人：中国人民解放军三二八零二部队，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人