一种大模型生成对抗样本的方法、装置、设备及存储介质制造方法及图纸

技术编号：42676148 阅读：26 留言：0更新日期：2024-09-10 12:28

本申请涉及一种大模型生成对抗样本的方法、装置、设备及存储介质，所述方法包括获取待优化输入数据，通过预设的对抗优化规则对待优化输入数据进行对抗优化，获得待测试输入数据；基于预设的多边形分析规则分析待测试输入数据，获得多边形待优化参数；将待测试输入数据输入目标模型进行测试，获得混合测试结果；根据多边形待优化参数和混合测试结果调整多边形分析规则，根据调整后的多边形分析规则调整对抗优化规则，基于调整后的对抗优化规则处理待优化输入数据，生成对抗样本数据。本申请具有提供了一种对抗样本生成方法，可以方便地应用于不同领域和场景，并加强生成样本与大模型的适应匹配性，提高对抗样本的对抗强度和通用性的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及对抗样本的，尤其是涉及一种大模型生成对抗样本的方法、装置、设备及存储介质。

技术介绍

1、随着人工智能技术的快速发展，大模型在诸多领域得到了广泛应用。然而，大模型的安全性问题也日益凸显，其中之一就是对抗样本的生成。对抗样本是指通过对原始输入数据进行微小改动，使得模型对其产生误判的样本，在机器学习领域，尤其是深度学习领域，对抗样本已经成为一个备受关注的研究方向。对抗样本是指那些经过精心设计的、能够误导机器学习模型做出错误预测的输入样本。这些样本通常通过在原始数据上添加微小的、人类难以察觉的扰动来生成，但足以让模型产生错误的输出。

2、相关技术中，对抗样本生成方法主要包括基于梯度的攻击、基于优化的攻击和基于决策边界的攻击等，上述方法通过利用模型的梯度信息、优化算法或者生成模型的能力来构造对抗样本。但是通过上述方法生成的对抗样本往往只能在特定的攻击场景下对模型产生有效的误导，一旦攻击场景发生变化，例如改变攻击强度、攻击方式或者目标模型的类型，这些对抗样本的误导能力就会显著下降。此外，在一个模型上生成的对抗样本往往难以...

【技术保护点】

1.一种大模型生成对抗样本的方法，其特征在于，所述大模型生成对抗样本的方法包括：

2.根据权利要求1所述的大模型生成对抗样本的方法，其特征在于，所述获取待优化输入数据，通过预设的对抗优化规则对所述待优化输入数据进行对抗优化，获得第一待测试输入数据和第二待测试输入数据，具体包括：

3.根据权利要求1所述的大模型生成对抗样本的方法，其特征在于，所述通过预设的混合测试规则，将所述第一待测试输入数据和所述第二待测试输入数据输入目标模型进行测试，获得混合测试结果，具体包括：

4.根据权利要求1所述的大模型生成对抗样本的方法，其特征在于，所述根据所述第一多边形待优...

【技术特征摘要】

1.一种大模型生成对抗样本的方法，其特征在于，所述大模型生成对抗样本的方法包括：

4.根据权利要求1所述的大模型生成对抗样本的方法，其特征在于，所述根据所述第一多边形待优化参数、所述第二多边形待优化参数和所述混合测试结果调整所述多边形分析规则，具体包括：

5.根据权利要求4所述的大模型生成对抗样本的方法，其特征在于...

【专利技术属性】
技术研发人员：付振波，李柯辰，李翔，彭旭，
申请(专利权)人：珠海市卓轩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人