【技术实现步骤摘要】
一种模型参数调整方法、装置、电子设备和存储介质
本申请实施例涉及计算机技术,尤其涉及人工智能
,特别涉及一种模型参数调整方法、装置、电子设备及存储介质。
技术介绍
模型鲁棒性是评价一个深度神经网络模型的重要指标。鉴于训练数据的非完备性和均匀分布的不可证明性,加之深度神经网络所固有的对抗样本等的存在,目前,没有方法可以保证深度神经网络模型输出结果的完全正确。该领域的主要工作是如何在较小的代价(比如有限的训练数据集,有限的计算资源和可接受的训练时间)下,尽可能保证输出的深度神经网络模型在测试集和验证集具备较高的准确性,并且在实际环境中具有较高的鲁棒性,可以适应各类环境变化或者人为因素导致的扰动和偏差,保证模型的可信。
技术实现思路
本申请实施例提供了一种模型参数调整方法、装置、电子设备及存储介质,以提升深度神经网络模型的鲁棒性。根据第一方面,提供了一种模型参数调整方法,包括:获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数;对各所述输入特征参数进行排序,根据排序结果选取数值最小的至少一个输入特征参数;将选取的各输入特征参数的数值调小。根据第二方面,提供了一种模型参数调整装置,包括:特征参数获取模块,用于获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数;排序筛选模块,用于对各所述输入特征参数进行排序,根据排序结果选取数值最小的至少一 ...
【技术保护点】
1.一种模型参数调整方法,包括:/n获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数;/n对各所述输入特征参数进行排序,根据排序结果选取数值最小的至少一个输入特征参数;/n将选取的各输入特征参数的数值调小。/n
【技术特征摘要】
1.一种模型参数调整方法,包括:
获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数;
对各所述输入特征参数进行排序,根据排序结果选取数值最小的至少一个输入特征参数;
将选取的各输入特征参数的数值调小。
2.根据权利要求1所述的方法,其中,将选取的各输入特征参数的数值调小,包括:
将选取的各输入特征参数的数值调整为0。
3.根据权利要求1所述的方法,其中,根据排序结果选取数值最小的至少一个输入特征参数,包括:
根据排序结果选取数值最小的N个输入特征参数,其中N等于输入特征参数的总个数乘以预设比例值后获得的整数值。
4.根据权利要求1所述的方法,其中,在将选取的各输入特征参数的数值调小之后,所述方法还包括:
判断是否已完成设定次数的迭代训练或者所述深度神经网络模型的准确度是否不低于预设值;
若是,则确定对所述深度神经网络模型的训练结束;若否,则将另一样本数据作为当前样本数据后,返回执行获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数的操作。
5.根据权利要求1所述的方法,其中,所述深度神经网络模型为卷积神经网络模型,所述设定网络层包括卷积层和/或全连接层。
6.根据权利要求1-5中任一项所述的方法,其中,在对所述深度神经网络模型的训练结束后,所述方法还包括:
获取验证样本集;
基于所述验证样本集和训练结束后获得的所述深度神经网络模型,生成第一对抗样本集;基于所述验证样本集和已有深度神经网络模型,生成第二对抗样本集;所述已有深度神经网络模型是采用已有训练方式训练获得的深度神经网络模型,所述已有训练方式是指在训练过程中未调整网络层的输入特征参数的训练方式;
根据第一对抗样本集确定所述已有深度神经网络模型的第一准确度,根据第二对抗样本集确定训练结束后获得的所述深度神经网络模型的第二准确度,将第一准确度和第二准确度进行输出,以根据输出内容确定模型训练效果。
7.根据权利要求6所述的方法,其中,根据第一对抗样本集确定所述已有深度神经网络模型的第一准确度,根据第二对抗样本集确定训练结束后获得的所述深度神经网络模型的第二准确度,包括:
将第一对抗样本集中的各第一对抗样本分别输入所述已有深度神经网络模型,获得所述已有深度神经网络模型针对各第一对抗样本分别输出的预测结果;通过将各预测结果与各第一对抗样本对应的标签信息进行比对,确定所述已有深度神经网络模型的预测准确率,将该预测准确率作为第一准确度;
将第二对抗样本集中的各第二对抗样本分别输入训练结束后获得的所述深度神经网络模型,获得训练结束后获得的所述深度神经网络模型针对各第二对抗样本分别输出的预测结果,通过将各预测结果与各第二对抗样本对应的标签信息进行比对,确定训练结束后获得的所述深度神经网络模型的预测准确率,将该预测准确率作为第二准确度。
8.一种模型参数调整装置,包括:
特征参数获取模块,用于获取使用当前样本数据对深度神经网络模型进行训练时,所述深度神经网络模型中包含的设定网络层的各输入特征参数;
排序筛选模块,用于对各所述输入特征参数进行排序,根据排序结果选取数值最小的至少一个...
【专利技术属性】
技术研发人员:吴月升,刘焱,王洋,郝新,熊俊峰,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。