【技术实现步骤摘要】
本申请涉及数据处理,特别是一种防御对抗样本攻击的方法、系统及存储介质。
技术介绍
1、对抗样本攻击是一种新兴的针对深度学习模型的攻击手段,通过对输入数据进行微小但有目的性的修改,欺骗模型输出错误结果。针对自然语言处理(natural languageprocessing,nlp)预训练模型的对抗攻击可能会误导搜索引擎输出错误信息,进而影响输出结果的可靠性。
2、为实现对对抗样本攻击的防御,一种可能的实现方式为计算高维空间中对抗样本和正常样本的局部内在维数,以判断是否发生对抗样本攻击。但是这种实现方式对对抗样本攻击检测的效果较差,导致对对抗样本攻击的防御效果较差。因此,如何增强对对抗样本攻击的防御效果,成为当前所需解决的技术问题。
技术实现思路
1、鉴于上述问题,本专利技术的目的在于提供一种防御对抗样本攻击的方法、系统及存储介质,以增强对抗样本攻击的防御效果,具体方案如下:
2、第一方面,本申请实施例提供了一种防御对抗样本攻击的方法,所述方法包括:
3、获
...【技术保护点】
1.一种防御对抗样本攻击的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取组合不确定性表达式,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述查询语料集合,生成第一对抗样本生成模型,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述第一对抗样本生成模型,确定所述组合不确定性表达式,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述组合不确定性表达式进行模型训练,得到对抗样本检测模型,包括:
6.根据权利要求1所述的方法,其特征在于,所述
...【技术特征摘要】
1.一种防御对抗样本攻击的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取组合不确定性表达式,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述查询语料集合,生成第一对抗样本生成模型,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述第一对抗样本生成模型,确定所述组合不确定性表达式,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述组合不确定性表达式进行模型训练,得到...
【专利技术属性】
技术研发人员:邵鸿飞,杜波,蔡玉柱,吕浩,倪宇志,王心怡,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。