一种基于差分进化算法的文本硬标签对抗攻击方法及系统技术方案

技术编号:41263704 阅读:27 留言:0更新日期:2024-05-11 09:20
本发明专利技术属于互联网安全技术领域,尤其涉及一种基于差分进化算法的文本硬标签对抗攻击方法及系统,基于差分进化思想,能够高效地实现对抗攻击,并生成语义相似且内容流畅的高质量对抗样本。本发明专利技术采用了多角度初始化对抗样本的方法,避免单一初始化导致的对抗样本局部最优问题,并结合了对关键单词的组合优化,从而有效提高了生成的对抗样本的质量。本发明专利技术能够以极小的开支实现对现实世界场景下的模型和API的对抗攻击,从而使硬标签的对抗攻击和防御研究更具可行性。本发明专利技术评估了攻击方法的有效性,实验结果表明,本发明专利技术方法不仅显著提高了攻击效率,并且在语义相似度、困惑度等方面的测试中,也取得了不错的结果。

【技术实现步骤摘要】

本专利技术属于互联网安全,尤其涉及一种基于差分进化算法的文本硬标签对抗攻击方法及系统


技术介绍

1、随着人工智能以及各类应用发展,硬标签攻击和对抗性攻击是当前计算机安全领域中仍有巨大研究空间的关键问题。在这一领域,使用硬标签模型的预测顶部标签来实现对抗性攻击已成为一个重要挑战和现实问题。目前的研究重点在于如何识别和利用标签模型的弱点,以欺骗或误导其输出,进而增强模型的安全性。

2、通过上述分析,现有技术存在的问题及缺陷为:

3、(1)由于依赖于群体的遗传优化算法,现有攻击方法需要消耗大量查询,效率不高;

4、(2)现有方法生成的对抗样本质量一般,与原始样本相比语义相似度以及困惑度都不理想;

5、(3)在真实场景下,无法实现有效的攻击任务,并由此为增强其鲁棒性提供了指导。

6、最接近的现有技术:基于深度学习模型的对抗样本生成方法。这种方法通常使用原始输入数据和模型的梯度信息,结合小的扰动来生成对抗样本。

7、现有技术存在的技术问题:

8、1)高度依赖模型梯度:该方法主要依赖本文档来自技高网...

【技术保护点】

1.一种基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,首先通过同义词替换生成初始对抗样本,然后最小化替换单词数量以缩小搜索空间。接着,在优化过程中,利用差分进化思想和语义相似性得分,通过变异、交叉和选择操作在每次迭代中评估和优化候选单词的质量,从而生成最优的对抗样本。

2.如权利要求1所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,包括:

3.如权利要求2所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,S1具体包括:

4.如权利要求2所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,S3具体包括:

...

【技术特征摘要】

1.一种基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,首先通过同义词替换生成初始对抗样本,然后最小化替换单词数量以缩小搜索空间。接着,在优化过程中,利用差分进化思想和语义相似性得分,通过变异、交叉和选择操作在每次迭代中评估和优化候选单词的质量,从而生成最优的对抗样本。

2.如权利要求1所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,包括:

3.如权利要求2所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,s1具体包括:

4.如权利要求2所述的基于差分进化算法的文本硬标签对抗攻击方法,其特征在于,s3具体包括:

5.一种应用如权利要求1~4...

【专利技术属性】
技术研发人员:彭浩王哲王艺桥钟鸣赵丹丹韩建民
申请(专利权)人:浙江师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1