当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法技术

技术编号:41283158 阅读:34 留言:0更新日期:2024-05-11 09:32
一种基于虚拟位置引导的VPG‑PSO算法的文本对抗攻击方法,属于文本对抗处理领域。首先采用基于义原的方法生成替换词,进而形成缩减的搜索空间。然后使用了一种基于虚拟位置引导的VPG‑PSO算法,应用于搜索对抗样本,将整个迭代过程分为发散、正常、加速三个阶段,使用不同的搜索策略。在发散阶段扩大粒子的运动范围,以实现全局搜索;正常阶段进行常规粒子群搜索;在加速阶段降低粒子在较大范围内的运动,从而实现快速收敛。并在每个阶段引入虚拟位置的概念,自适应调整算法的搜索行为,从而进行不同的搜索。在保持语义一致性的前提下,以更低的成本实现了更高的成功率。

【技术实现步骤摘要】

本专利技术属于文本对抗处理领域,具体涉及一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法。


技术介绍

1、机器学习方法,尤其是深度神经网络,在自然语言处理(nlp)任务中取得了显著成果,如垃圾邮件过滤、情感分析和假新闻检测。尽管最先进的模型在一些任务上已达到接近100%的准确率,但它们对于对抗攻击不够敏感。这意味着一个好的模型在初始阶段能对输入示例进行正确分类,然而在注入人类难以察觉的噪声以生成对抗样本时,模型可能会出现错误。因此,有必要研究文本对抗攻击方法,以便构建更具鲁棒性的模型,开发更强大的防御手段来处理nlp任务。

2、文本对抗攻击可以根据基本变化单位分为三类:字符级、词级和句子级。其中词级攻击通过替换少量单词生成对抗样本,在一致性和修改率上都有出色表现。近年来,涌现出多种词级对抗攻击方法。papernot等人首次提出生成文本对抗样本的想法,从整个字典中搜索替换词,并使用梯度下降算法选择合适词。liang等人将整个字典定义为搜索空间,并采用模糊技术确定插入、删除或修改词的位置。然而,这两种方法均无法保证保持原句意义或语法正确性本文档来自技高网...

【技术保护点】

1.一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,所述步骤三中,候选词对受害模型造成的最大伤害即在仅将原始输入样本中一个原词替换为候选词列表中某一个候选词的情况下,受害模型预测该样本为目标错误标签的概率。

3.根据权利要求1所述的一种基于虚拟位置引导的VPG-PSO算法的文本对抗攻击方法,其特征在于,所述步骤三中,所述的原始输入样本O各位置候选词所有的替换组合是指:原始输入样本O中各位置原词被替换与不被替换所有情况的组合形式。<...

【技术特征摘要】

1.一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的一种基于虚拟位置引导的vpg-pso算法的文本对抗攻击方法,其特征在于,所述步骤三中,候选词对受害模型造成的最大伤害即在仅将原始输入样本中一个原词替换为候选词列表中某一个候选词的情况下,受害模型预测该样本为目标错误标签的概率。

3.根据权利要求1所述的一种基于虚拟位置...

【专利技术属性】
技术研发人员:殷快快孙俊李超陈灏张冠宇于子皓夏志宇
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1