【技术实现步骤摘要】
本专利技术属于文本对抗处理领域,具体涉及一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法。
技术介绍
1、机器学习方法,尤其是深度神经网络,在自然语言处理(nlp)任务中取得了显著成果,如垃圾邮件过滤、情感分析和假新闻检测。尽管最先进的模型在一些任务上已达到接近100%的准确率,但它们对于对抗攻击不够敏感。这意味着一个好的模型在初始阶段能对输入示例进行正确分类,然而在注入人类难以察觉的噪声以生成对抗样本时,模型可能会出现错误。因此,有必要研究文本对抗攻击方法,以便构建更具鲁棒性的模型,开发更强大的防御手段来处理nlp任务。
2、文本对抗攻击可以根据基本变化单位分为三类:字符级、词级和句子级。其中词级攻击通过替换少量单词生成对抗样本,在一致性和修改率上都有出色表现。近年来,涌现出多种词级对抗攻击方法。papernot等人首次提出生成文本对抗样本的想法,从整个字典中搜索替换词,并使用梯度下降算法选择合适词。liang等人将整个字典定义为搜索空间,并采用模糊技术确定插入、删除或修改词的位置。然而,这两种方法均无法保证保持
...【技术保护点】
1.一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,具体步骤如下:
2.根据权利要求1所述的一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,所述步骤三中,候选词对受害模型造成的最大伤害即在仅将原始输入样本中一个原词替换为候选词列表中某一个候选词的情况下,受害模型预测该样本为目标错误标签的概率。
3.根据权利要求1所述的一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,所述步骤三中,所述的原始输入样本O各位置候选词所有的替换组合是指:原始输入样本O中各位置原词被替换与不被替换所
...【技术特征摘要】
1.一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法,其特征在于,具体步骤如下:
2.根据权利要求1所述的一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法,其特征在于,所述步骤三中,候选词对受害模型造成的最大伤害即在仅将原始输入样本中一个原词替换为候选词列表中某一个候选词的情况下,受害模型预测该样本为目标错误标签的概率。
3.根据权利要求1所述的一种基于虚拟位置...
【专利技术属性】
技术研发人员:殷快快,孙俊,李超,陈灏,张冠宇,于子皓,夏志宇,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。