【技术实现步骤摘要】
本专利技术涉及对抗样本的,尤其是涉及一种大模型生成对抗样本的方法、装置、设备及存储介质。
技术介绍
1、随着人工智能技术的快速发展,大模型在诸多领域得到了广泛应用。然而,大模型的安全性问题也日益凸显,其中之一就是对抗样本的生成。对抗样本是指通过对原始输入数据进行微小改动,使得模型对其产生误判的样本,在机器学习领域,尤其是深度学习领域,对抗样本已经成为一个备受关注的研究方向。对抗样本是指那些经过精心设计的、能够误导机器学习模型做出错误预测的输入样本。这些样本通常通过在原始数据上添加微小的、人类难以察觉的扰动来生成,但足以让模型产生错误的输出。
2、相关技术中,对抗样本生成方法主要包括基于梯度的攻击、基于优化的攻击和基于决策边界的攻击等,上述方法通过利用模型的梯度信息、优化算法或者生成模型的能力来构造对抗样本。但是通过上述方法生成的对抗样本往往只能在特定的攻击场景下对模型产生有效的误导,一旦攻击场景发生变化,例如改变攻击强度、攻击方式或者目标模型的类型,这些对抗样本的误导能力就会显著下降。此外,在一个模型上生成的对抗样本往往难以
...【技术保护点】
1.一种大模型生成对抗样本的方法,其特征在于,所述大模型生成对抗样本的方法包括:
2.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述获取待优化输入数据,通过预设的对抗优化规则对所述待优化输入数据进行对抗优化,获得第一待测试输入数据和第二待测试输入数据,具体包括:
3.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述通过预设的混合测试规则,将所述第一待测试输入数据和所述第二待测试输入数据输入目标模型进行测试,获得混合测试结果,具体包括:
4.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述根
...【技术特征摘要】
1.一种大模型生成对抗样本的方法,其特征在于,所述大模型生成对抗样本的方法包括:
2.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述获取待优化输入数据,通过预设的对抗优化规则对所述待优化输入数据进行对抗优化,获得第一待测试输入数据和第二待测试输入数据,具体包括:
3.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述通过预设的混合测试规则,将所述第一待测试输入数据和所述第二待测试输入数据输入目标模型进行测试,获得混合测试结果,具体包括:
4.根据权利要求1所述的大模型生成对抗样本的方法,其特征在于,所述根据所述第一多边形待优化参数、所述第二多边形待优化参数和所述混合测试结果调整所述多边形分析规则,具体包括:
5.根据权利要求4所述的大模型生成对抗样本的方法,其特征在于...
【专利技术属性】
技术研发人员:付振波,李柯辰,李翔,彭旭,
申请(专利权)人:珠海市卓轩科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。