【技术实现步骤摘要】
本专利技术涉及一种大语言模型学习方法,尤其涉及一种保护数据隐私的上下文学习方法。
技术介绍
1、当前数字化时代,人工智能技术在各个行业领域发挥着重要作用,其中大语言模型(llm)以其出色的语言生成能力,成为一项引人注目的技术。这些大语言模型是在预训练语言模型(plm)的基础上发展起来的,其性能的提升得益于信息时代数据量和计算能力的显著增长。大语言模型在自然语言理解和生成任务中展现出巨大的潜力。
2、上下文学习(icl)是大语言模型研究的一个分支,它允许模型通过提供少量示例来解决新问题,而无需对模型权重进行任何调整。这种学习方式的关键在于从类比中学习,通过构建上下文演示并将其与查询问题结合,形成带有提示的输入,进而进行模型预测。
3、目前的问题在于:
4、1)尽管上下文学习提供了一种低成本的微调训练方案,它也存在一些隐私泄露的风险,攻击者可能通过提示词注入攻击诱导模型输出上下文示例的内容,导致示例中的隐私信息泄露。在个人隐私安全日益受到重视的今天,这种隐私泄露问题不容忽视。
5、2)差分隐私...
【技术保护点】
1.一种保护数据隐私的上下文学习方法,其特征在于:所述上下文学习方法包括:
2.根据权利要求1所述保护数据隐私的上下文学习方法,其特征在于:所述在对大语言模型进行预训练过程中,对训练数据的梯度实施自适应加噪处理,其具体实现的方法包括:
3.根据权利要求2所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术。
4.根据权利要求3所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术之时,所添加的噪声,其标准差σ将根据每轮训练的损失值进行自...
【技术特征摘要】
1.一种保护数据隐私的上下文学习方法,其特征在于:所述上下文学习方法包括:
2.根据权利要求1所述保护数据隐私的上下文学习方法,其特征在于:所述在对大语言模型进行预训练过程中,对训练数据的梯度实施自适应加噪处理,其具体实现的方法包括:
3.根据权利要求2所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术。
4.根据权利要求3所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术之时,所添加的噪声,其标准差σ将根据每轮训练的损失值进行自适应的调整,该标准差σ的计算公式为:
5....
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。