当前位置: 首页 > 专利查询>浙江大学专利>正文

一种大模型提示词版权验证方法及装置制造方法及图纸

技术编号:40833686 阅读:16 留言:0更新日期:2024-04-01 14:57
本发明专利技术公开了一种大模型提示词版权验证方法及装置,该方法是通过利用双层优化的提示词水印注入与验证方法。在提示水印注入阶段,同步训练提示词任务与提示词水印注入任务,确保在不对大模型提示词的原有指令功能造成影响的前提下完成水印注入;在提示词水印验证阶段,通过构建假设检验模型,对所提取的信号单词分布进行分析,从而实现提示词水印的验证,以保障提示词的版权。

【技术实现步骤摘要】

本专利技术属于神经网络安全,尤其涉及一种大模型提示词版权验证方法及装置


技术介绍

1、随着大模型(如gpt-4、llama)性能的不断提升,在情感分析、文段总结归纳以及语言翻译等下游任务中,其准确性和熟练程度已接近甚至超越人类水平。大模型提示词作为人与大模型间的沟通纽带,对于引导大模型输出高质量内容具有重要作用。所谓大模型提示词,是指人与大型语言模型进行交互时,输入查询语句之后的单词或语句,用于引导大模型输出人所需求的响应内容。在这种交互中,提示词的准确性至关重要。一个优质的提示能够引导模型生成高质量且富有创意的内容,有时甚至能决定某个任务的成败。此外,用于训练提示词的特定数据集可能包含敏感的个人信息,如果提示词被泄露,这些信息容易受到隐私推理攻击。目前,针对大型模型使用场景中提示词版权保护方案的研究尚属空白。随着提示词在各个场景中的广泛应用,如何保护其版权已经成为一个亟待解决的问题。

2、近年来,大量专利(如cn116881871a、cn116861379a、cn116128700a)提出了模型水印技术,旨在保护深度神经网络模型的知识产权。本文档来自技高网...

【技术保护点】

1.一种大模型提示词版权验证方法,其特征在于,包括:

2.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(1)是利用Top-k策略,再利用所训练的逻辑分类器提取标签单词、信号单词;具体为包括如下子步骤:

3.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,利用步骤(1)中的标签单词与信号单词构造出了标准数据集和水印数据集其中,xprompt和xtrigger均属于占位符,在步骤(2)中优化更新并填充;所述xtrigger为秘钥。

4.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(2)中,基于双层优化训练机...

【技术特征摘要】

1.一种大模型提示词版权验证方法,其特征在于,包括:

2.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(1)是利用top-k策略,再利用所训练的逻辑分类器提取标签单词、信号单词;具体为包括如下子步骤:

3.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,利用步骤(1)中的标签单词与信号单词构造出了标准数据集和水印数据集其中,xprompt和xtrigger均属于占位符,在步骤(2)中优化更新并填充;所述xtrigger为秘钥。

4.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(2)中,基于双层优化训练机制包括下层优化和上层优化两个步骤,其中,下层优化使用标准数据集和水印数据集优化提示词xprompt,上层优化使用水印数据集优化私钥xtrigger,优化目标函数表示为:

5.根据权利要求4所述的大模型提示词版权验证方法,其特征在于,下层优化的目标是在求出最优的提示词,使模型对于输入查询语句x+xprompt或x+xtrigger+xp...

【专利技术属性】
技术研发人员:姚宏伟娄坚秦湛任奎
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1