当前位置: 首页 > 专利查询>复旦大学专利>正文

保护数据隐私的上下文学习方法技术

技术编号:44096992 阅读:57 留言:0更新日期:2025-01-21 12:30
本发明专利技术公开了一种保护数据隐私的上下文学习方法。所述上下文学习方法包括:在对大语言模型进行预训练过程中,对训练数据的梯度实施自适应加噪处理;根据预训练得到的大语言模型和指定的格式指令,逐Token构建生成上下文示例,在构建生成上下文示例的过程中,Token生成时实施自适应加噪处理;在大语言模型推理过程中,将具备隐私保护的上下文示例与用户的输入内容进行拼接结合,形成带有提示的输入,输入到大语言模型中进行预测和推理。本发明专利技术的上下文学习方法中,通过自适应加噪策略动态调整添加噪声的尺度,这样一来,可以在保护隐私的同时减少对模型性能的影响,最终实现了增强隐私保护和优化模型性能的技术效果。

【技术实现步骤摘要】

本专利技术涉及一种大语言模型学习方法,尤其涉及一种保护数据隐私的上下文学习方法


技术介绍

1、当前数字化时代,人工智能技术在各个行业领域发挥着重要作用,其中大语言模型(llm)以其出色的语言生成能力,成为一项引人注目的技术。这些大语言模型是在预训练语言模型(plm)的基础上发展起来的,其性能的提升得益于信息时代数据量和计算能力的显著增长。大语言模型在自然语言理解和生成任务中展现出巨大的潜力。

2、上下文学习(icl)是大语言模型研究的一个分支,它允许模型通过提供少量示例来解决新问题,而无需对模型权重进行任何调整。这种学习方式的关键在于从类比中学习,通过构建上下文演示并将其与查询问题结合,形成带有提示的输入,进而进行模型预测。

3、目前的问题在于:

4、1)尽管上下文学习提供了一种低成本的微调训练方案,它也存在一些隐私泄露的风险,攻击者可能通过提示词注入攻击诱导模型输出上下文示例的内容,导致示例中的隐私信息泄露。在个人隐私安全日益受到重视的今天,这种隐私泄露问题不容忽视。

5、2)差分隐私(dp)虽然被认为是本文档来自技高网...

【技术保护点】

1.一种保护数据隐私的上下文学习方法,其特征在于:所述上下文学习方法包括:

2.根据权利要求1所述保护数据隐私的上下文学习方法,其特征在于:所述在对大语言模型进行预训练过程中,对训练数据的梯度实施自适应加噪处理,其具体实现的方法包括:

3.根据权利要求2所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术。

4.根据权利要求3所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术之时,所添加的噪声,其标准差σ将根据每轮训练的损失值进行自适应的调整,该标准差...

【技术特征摘要】

1.一种保护数据隐私的上下文学习方法,其特征在于:所述上下文学习方法包括:

2.根据权利要求1所述保护数据隐私的上下文学习方法,其特征在于:所述在对大语言模型进行预训练过程中,对训练数据的梯度实施自适应加噪处理,其具体实现的方法包括:

3.根据权利要求2所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术。

4.根据权利要求3所述保护数据隐私的上下文学习方法,其特征在于:在对训练数据的梯度实施自适应加噪处理时,采用差分隐私技术之时,所添加的噪声,其标准差σ将根据每轮训练的损失值进行自适应的调整,该标准差σ的计算公式为:

5....

【专利技术属性】
技术研发人员:金玲飞冯煜
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1