基于同义词嵌入的对抗样本防御方法、装置、设备及存储介质制造方法及图纸

技术编号:45058441 阅读:22 留言:0更新日期:2025-04-22 17:41
本发明专利技术提供了一种基于同义词嵌入的对抗样本防御方法、装置、设备及存储介质,涉及软件安全技术领域。该方法采用先检测后还原的方式,首先,通过层概率分布差异得到对抗性得分,根据对抗性得分设置动态扰动率,对干净样本和潜在对抗样本采取不同的扰动率,尽量减少对干净样本的干扰。然后,对同义词集平均值进行嵌入,以降低模型对输入样本中特定单词的敏感性,期望还原原始标签。最后,对多个结果采用软投票的方式,以缓解同义词嵌入带来的随机性,选择模型最终输出的分类标签。本发明专利技术设计了一种有效的防御方法,用于检测和抵御对抗攻击并提高其鲁棒性,旨在提高系统稳定性,保证用户体验。

【技术实现步骤摘要】

本专利技术涉及软件安全,尤其涉及一种基于同义词嵌入的对抗样本防御方法、装置、设备及存储介质


技术介绍

1、近年来,深度神经网络的快速发展已在旅游行业中得到广泛应用。通过智能推荐系统、虚拟导览和自动客服等技术,游客能够获得更个性化和便捷的服务。例如,旅行平台可以根据用户的历史行为和偏好推荐合适的旅游路线和酒店,智能助手可以实时回答游客的各种问题。这不仅提升了用户体验,也推动了旅游业的数字化转型。

2、然而,研究表明,深度神经网络的局部线性特性和高维数据处理特性,使其在安全性上容易受到对抗样本的攻击。这些攻击可能导致系统推荐错误的旅游信息、价格错误或行程混乱,影响用户体验,甚至造成经济损失。例如,恶意对抗样本可能通过微小的输入变化,误导推荐系统提供不相关的旅游产品或服务。

3、自从对抗样本的概念被提出后,许多研究集中在计算机视觉领域,探讨如何生成和防御这些样本。然而,在旅游相关的自然语言处理(nlp)应用中,如智能客服和评论分析,相关研究仍相对较少。nlp模型的鲁棒性和安全性问题同样关键,需要更多关注和研究,以确保旅游行业的智能系统能本文档来自技高网...

【技术保护点】

1.一种基于同义词嵌入的对抗样本防御方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于同义词嵌入的对抗样本防御方法,其特征在于,所述生成虚拟样本,具体包括:

3.根据权利要求2所述的基于同义词嵌入的对抗样本防御方法,其特征在于,使用KL散度计算原始文本x和虚拟样本x′中两个输出概率分布之间的距离D(f(x),f(x′)):

4.根据权利要求2所述的基于同义词嵌入的对抗样本防御方法,其特征在于,对单词进行重要性排序操作之前,还包括:

5.根据权利要求4所述的基于同义词嵌入的对抗样本防御方法,其特征在于,对单词进行重要性排序操作之前...

【技术特征摘要】

1.一种基于同义词嵌入的对抗样本防御方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于同义词嵌入的对抗样本防御方法,其特征在于,所述生成虚拟样本,具体包括:

3.根据权利要求2所述的基于同义词嵌入的对抗样本防御方法,其特征在于,使用kl散度计算原始文本x和虚拟样本x′中两个输出概率分布之间的距离d(f(x),f(x′)):

4.根据权利要求2所述的基于同义词嵌入的对抗样本防御方法,其特征在于,对单词进行重要性排序操作之前,还包括:

5.根据权利要求4所述的基于同义词嵌入的对抗样本防御方法,其特征在于,对单词进行重要性排序操作之前,还包括计算当前位置单词与其他位置单词的关联程度:

6.根据权利要求5所述的基于同义词嵌入的对抗样本防御方法,其特...

【专利技术属性】
技术研发人员:郭依坤戴煜黄达魏玥刘仁宝
申请(专利权)人:中电鸿信信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1