【技术实现步骤摘要】
本专利技术属于神经网络安全,尤其涉及一种大模型提示词版权验证方法及装置。
技术介绍
1、随着大模型(如gpt-4、llama)性能的不断提升,在情感分析、文段总结归纳以及语言翻译等下游任务中,其准确性和熟练程度已接近甚至超越人类水平。大模型提示词作为人与大模型间的沟通纽带,对于引导大模型输出高质量内容具有重要作用。所谓大模型提示词,是指人与大型语言模型进行交互时,输入查询语句之后的单词或语句,用于引导大模型输出人所需求的响应内容。在这种交互中,提示词的准确性至关重要。一个优质的提示能够引导模型生成高质量且富有创意的内容,有时甚至能决定某个任务的成败。此外,用于训练提示词的特定数据集可能包含敏感的个人信息,如果提示词被泄露,这些信息容易受到隐私推理攻击。目前,针对大型模型使用场景中提示词版权保护方案的研究尚属空白。随着提示词在各个场景中的广泛应用,如何保护其版权已经成为一个亟待解决的问题。
2、近年来,大量专利(如cn116881871a、cn116861379a、cn116128700a)提出了模型水印技术,旨在保护深度神经
...【技术保护点】
1.一种大模型提示词版权验证方法,其特征在于,包括:
2.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(1)是利用Top-k策略,再利用所训练的逻辑分类器提取标签单词、信号单词;具体为包括如下子步骤:
3.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,利用步骤(1)中的标签单词与信号单词构造出了标准数据集和水印数据集其中,xprompt和xtrigger均属于占位符,在步骤(2)中优化更新并填充;所述xtrigger为秘钥。
4.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(2)中
...【技术特征摘要】
1.一种大模型提示词版权验证方法,其特征在于,包括:
2.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(1)是利用top-k策略,再利用所训练的逻辑分类器提取标签单词、信号单词;具体为包括如下子步骤:
3.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,利用步骤(1)中的标签单词与信号单词构造出了标准数据集和水印数据集其中,xprompt和xtrigger均属于占位符,在步骤(2)中优化更新并填充;所述xtrigger为秘钥。
4.根据权利要求1所述的大模型提示词版权验证方法,其特征在于,在步骤(2)中,基于双层优化训练机制包括下层优化和上层优化两个步骤,其中,下层优化使用标准数据集和水印数据集优化提示词xprompt,上层优化使用水印数据集优化私钥xtrigger,优化目标函数表示为:
5.根据权利要求4所述的大模型提示词版权验证方法,其特征在于,下层优化的目标是在求出最优的提示词,使模型对于输入查询语句x+xprompt或x+xtrigger+xp...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。