一种防御对抗样本攻击的方法、系统及存储介质技术方案

技术编号：44737703 阅读：21 留言：0更新日期：2025-03-21 18:04

本申请实施例提供了一种防御对抗样本攻击的方法、系统及存储介质，用于增强对抗样本攻击的防御效果，所述方法包括：获取组合不确定性表达式；所述组合不确定性表达式为对神经网络模型的认知不确定性和偶然不确定性进行组合的表达式；基于所述组合不确定性表达式进行模型训练，得到对抗样本检测模型；在接收到待搜索文本时，将所述待搜索文本输入至所述对抗样本检测模型，确定待搜索文本类型；所述待搜索文本类型包括：正常文本和非正常文本；若所述待搜索文本类型为所述非正常文本，则拒绝搜索请求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，特别是一种防御对抗样本攻击的方法、系统及存储介质。

技术介绍

1、对抗样本攻击是一种新兴的针对深度学习模型的攻击手段，通过对输入数据进行微小但有目的性的修改，欺骗模型输出错误结果。针对自然语言处理(natural languageprocessing，nlp)预训练模型的对抗攻击可能会误导搜索引擎输出错误信息，进而影响输出结果的可靠性。

2、为实现对对抗样本攻击的防御，一种可能的实现方式为计算高维空间中对抗样本和正常样本的局部内在维数，以判断是否发生对抗样本攻击。但是这种实现方式对对抗样本攻击检测的效果较差，导致对对抗样本攻击的防御效果较差。因此，如何增强对对抗样本攻击的防御效果，成为当前所需解决的技术问题。

技术实现思路

1、鉴于上述问题，本专利技术的目的在于提供一种防御对抗样本攻击的方法、系统及存储介质，以增强对抗样本攻击的防御效果，具体方案如下：

2、第一方面，本申请实施例提供了一种防御对抗样本攻击的方法，所述方法包括：

3、获...

【技术保护点】

1.一种防御对抗样本攻击的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取组合不确定性表达式，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述查询语料集合，生成第一对抗样本生成模型，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述第一对抗样本生成模型，确定所述组合不确定性表达式，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述组合不确定性表达式进行模型训练，得到对抗样本检测模型，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

...

【技术特征摘要】

1.一种防御对抗样本攻击的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取组合不确定性表达式，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述查询语料集合，生成第一对抗样本生成模型，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述第一对抗样本生成模型，确定所述组合不确定性表达式，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述组合不确定性表达式进行模型训练，得到...

【专利技术属性】
技术研发人员：邵鸿飞，杜波，蔡玉柱，吕浩，倪宇志，王心怡，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人