【技术实现步骤摘要】
本申请涉及大语言模型,尤其涉及一种多模态大模型的对抗攻击方法、装置及设备。
技术介绍
1、近年来,随着chatgpt等多模态大语言模型(以下简称多模态大模型)在自然语言理解和生成中的显著表现,越来越多的多模态大模型被开发出来用于机器翻译、机器人聊天等下游任务。开发者通过将强大的大语言模型与用于视觉处理的视觉编码器visionencoder进行结合,使视觉-语言多模态大模型能够处理视觉输入,并表现出接近人类的图像理解以及文本生成能力,这种多模态大模型,如gpt-4,未来将被应用于各种图文生成、图文问答任务中,如新闻文章生成等。
2、在经历了大量人类语料训练,指令微调(instruction fine-tuning)以及人类反馈强化学习(reinforcement learning from human feedback,rlhf)后,多模态大模型不仅能够客观地描述事物,还能够用一些较为主观的词语形容事物的外貌,姿态等,进而使得大模型生成的输出具有了像人类一样的情感,也即多模态大模型具有类人的情感表达能力。
3、但由
...【技术保护点】
1.一种多模态大模型的对抗攻击方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标描述生成对抗样本,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标描述生成对抗样本,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述多模态大模型的模型参数以及所述目标描述生成所述对抗样本,包括:
5.根据权利要求4所述的方法,其特征在于,所述第一对抗样本生成公式包括:
6.根据权利要求3所述的方法,其特征在于,所述根据所述多模态大模型的模型参数以及所述目标描
...【技术特征摘要】
1.一种多模态大模型的对抗攻击方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标描述生成对抗样本,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标描述生成对抗样本,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述多模态大模型的模型参数以及所述目标描述生成所述对抗样本,包括:
5.根据权利要求4所述的方法,其特征在于,所述第一对抗样本生成公式包括:
6.根据权利要求3所述的方法,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。