当前位置: 首页 > 专利查询>扬州大学专利>正文

一种基于提示调优的文本对抗防御方法技术

技术编号:42091264 阅读:24 留言:0更新日期:2024-07-19 17:05
本发明专利技术公开了一种基于提示调优的文本对抗防御方法,包括1)采取四种策略对原始文本进行添加扰动形成对抗文本,并引入源域和目标域来模拟原始文本和对抗文本;2)手动构建提示调优模型的模板;3)在标签词映射器的构建中使用三种词汇注释工具在目标域上进行标注,根据主题分类或情感分类的任务类型抽取名词或形容词,并采用分层聚类和优化策略得到最终的标签词;4)随机选取少量源域数据样本,基于步骤2)和步骤3)中构建出优化的提示调优模型,实现对抗文本的分类预测。本发明专利技术基于提示调优模型,在少量源域数据样本的前提下,解决了多种文本攻击方法对文本准确分类的影响,实现文本对抗防御。

【技术实现步骤摘要】

本专利技术涉及文本对抗以及迁移学习研究领域,特别涉及一种基于提示调优的文本对抗防御方法


技术介绍

1、对抗攻击指的是对目标机器学习模型的原输入施加轻微扰动以生成对抗样本来欺骗目标模型的过程。对抗攻击可以暴露机器学习模型的脆弱性,进而提高模型的鲁棒性和可解释性。面对文本对抗性攻击,必然产生相应的防御需求。防御中常用的两种主要方法是:对抗性训练和知识蒸馏。对抗性训练是一种直观的防御方法,主要针对对抗性样本进行训练,旨在提高鲁棒性。而知识蒸馏则是对神经网络模型进行操作,训练出新的模型以降低对扰动的敏感性。

2、领域自适应方法主要分为浅层学习和深度学习两类。在浅层学习方法中,多采用基于统计模型的策略,这些方法在准确性和稳定性方面表现出色。然而,目前的浅层学习方法在处理跨领域特征表示学习时尚未取得理想的效果,这影响了领域自适应性能的表现。近年来,深度学习方法因其出色的特征学习能力而在领域自适应中得到广泛应用。这些方法能够将源域和目标域的特征表示映射到一个共同的新特征空间,从而提升模型性能。然而,目前的深度神经网络在优化网络和模型时通常需要大量的有标签或本文档来自技高网...

【技术保护点】

1.一种基于提示调优的文本对抗防御方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其特征在于,所述步骤2)具体包括:

4.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其特征在于,所述步骤3)具体包括:

5.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其特征在于,所述步骤4)具体包括:

【技术特征摘要】

1.一种基于提示调优的文本对抗防御方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求1所述的一种基于提示调优的文本对抗防御方法,其...

【专利技术属性】
技术研发人员:朱毅李政隆袁旭李云袁运浩强继朋
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1