System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练装置、训练方法以及训练程序制造方法及图纸_技高网

训练装置、训练方法以及训练程序制造方法及图纸

技术编号:40419878 阅读:7 留言:0更新日期:2024-02-20 22:38
训练装置(10)取得用于对包含对抗样本的输入数据的标签进行预测的模型的训练数据。并且,训练装置(10)使用如下的损失函数和包含对抗样本的训练数据来对模型进行训练,该损失函数是在对模型的参数添加了噪声的情况下和未添加噪声的情况下,对该模型的参数添加使该模型中的损失值的KL散度成为最大的噪声,并使针对该参数的损失曲面变得平坦的损失函数。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及模型的训练装置、训练方法以及训练程序


技术介绍

1、以往,存在通过对作为分类对象的数据添加噪声来使分类器进行错误判定的对抗样本(adversarial example)这样的攻击。作为针对该对抗样本的对策,例如有使用对抗样本进行模型(分类器)的训练的对抗训练(adversarial training)。

2、但是,通过对抗训练训练出的模型存在泛化性能低的问题。这是因为针对通过对抗训练训练出的模型的权重(weight)的损失曲面(loss landscape)(损失函数的形状)尖锐。因此,为了使上述的损失曲面变得平坦,存在在使模型的损失(loss)最大化的方向上对权重添加噪声(扰动)的技术。

3、现有技术文献

4、非专利文献

5、非专利文献1:diederik p.kingma,max welling,“auto-encoding variationalbayes”,[2021年6月4日检索],网址<url:https://arxiv.org/pdf/1312.6114.pdf>

6、非专利文献2:dongxian wu,shu-tao xia,yisen wang,“adversarial weightperturbation helps robust generalization”,[2021年6月4日检索],网址<url:https://arxiv.org/pdf/2004.05884>


技术实现思

1、专利技术要解决的课题

2、但是,上述的技术存在针对没有噪声的数据的预测性能降低的问题。因此,本专利技术的课题在于,解决上述问题,并训练出如下模型:能够确保针对对抗样本的稳健性,并且针对没有噪声的数据也能够高精度地进行预测。

3、为了解决上述课题,本专利技术的特征在于,具备:数据取得部,其取得用于对包含对抗样本的输入数据的标签进行预测的模型的训练数据;以及训练部,其使用如下的损失函数和包含所述对抗样本的训练数据来对所述模型进行训练,所述损失函数是在对所述模型的参数添加了噪声的情况下和未添加噪声的情况下,对参数添加使所述模型中的损失值的kl散度成为最大的噪声,并使针对所述参数的损失曲面变得平坦的损失函数。

4、专利技术的效果

5、根据本专利技术,能够训练出如下模型:能够确保针对对抗样本的稳健性,并且针对没有噪声的数据也能够高精度地进行预测。

本文档来自技高网...

【技术保护点】

1.一种训练装置,其特征在于,具备:

2.根据权利要求1所述的训练装置,其特征在于,

3.根据权利要求1所述的训练装置,其特征在于,

4.一种训练方法,其由训练装置执行,其特征在于,

5.一种训练程序,其用于使计算机执行以下工序:

【技术特征摘要】
【国外来华专利技术】

1.一种训练装置,其特征在于,具备:

2.根据权利要求1所述的训练装置,其特征在于,

3.根据权利要求1所述的训练装...

【专利技术属性】
技术研发人员:山田真德
申请(专利权)人:日本电信电话株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1