当前位置: 首页 > 专利查询>广州大学专利>正文

基于大型语言模型服务的个人数据隐私保护与恢复方法技术

技术编号:41931406 阅读:27 留言:0更新日期:2024-07-05 14:27
本发明专利技术公开了基于大型语言模型服务的个人数据隐私保护与恢复方法,涉及个人隐私信息保护领域,该方法包括以下步骤:利用历史数据集训练隐私信息分类模型,得到预训练隐私信息分类模型;清洗输入文本,并利用预训练隐私信息分类模型对清洗后的输入文本进行分类;基于分类结果,利用词语权重算法确定个人隐私信息,组建个人隐私词汇列表,并根据个人隐私词汇列表进行脱敏保护操作,得到脱敏保护文本;将脱敏保护文本输入大语言模型,对大语言模型返回的答案进行还原恢复操作,得到还原恢复文本。本发明专利技术不仅能够确保大型语言模型的准确性和效率,还能保护用户个人隐私数据免受未经授权的访问和泄露。

【技术实现步骤摘要】

本专利技术涉及个人隐私信息保护领域,具体来说,涉及基于大型语言模型服务的个人数据隐私保护与恢复方法


技术介绍

1、随着人工智能技术的飞速发展,大型语言模型已经广泛应用于自然语言处理领域,展现出强大的文本生成和理解能力。这些模型通过吸收大量文本数据来训练,能够提供准确的响应和预测,然而,随着模型规模和复杂性的增加,用户个人隐私和数据安全问题变得日益突出,用户在使用大型语言模型服务时,往往需要将个人数据上传到云端进行处理,这增加了数据泄露和滥用的风险,因此,如何在保障用户个人隐私的同时,确保大型语言模型服务的高效运行成为了一个亟待解决的问题。

2、近年来,为解决大型语言模型中的个人隐私保护问题,研究人员提出了一系列方案,其中,一种常见的做法是在云端进行脱敏处理,即在上传用户数据到模型之前,先通过算法或规则识别出文本中的个人隐私信息,并进行替换、删除或加密;这种方法虽然能在一定程度上保护用户个人隐私,但是其缺点是仍然存在数据泄露的风险,因为个人隐私信息仍然需要在云端进行处理;此外,脱敏处理可能会对模型的性能和准确性产生负面影响,因为一些关键信息可能本文档来自技高网...

【技术保护点】

1.基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,该基于大型语言模型服务的个人数据隐私保护与恢复方法包括以下步骤:

2.根据权利要求1所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述利用历史数据集训练隐私信息分类模型,得到预训练隐私信息分类模型包括以下步骤:

3.根据权利要求2所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述损失函数的表达式为:

4.根据权利要求3所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述基于隐私信息分类模型的优化目标,利用个人隐私训练数据集训...

【技术特征摘要】

1.基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,该基于大型语言模型服务的个人数据隐私保护与恢复方法包括以下步骤:

2.根据权利要求1所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述利用历史数据集训练隐私信息分类模型,得到预训练隐私信息分类模型包括以下步骤:

3.根据权利要求2所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述损失函数的表达式为:

4.根据权利要求3所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述基于隐私信息分类模型的优化目标,利用个人隐私训练数据集训练隐私信息分类模型,得到隐私信息分类模型的最优参数包括:

5.根据权利要求4所述的基于大型语言模型服务的个人数据隐私保护与恢复方法,其特征在于,所述清洗输入文本,并利用预训练隐私信息分类模型对清洗后的输入文本进行分类包括以下步骤:

6.根据权利要求5所述的基于大型语言模型服务的个人数据隐...

【专利技术属性】
技术研发人员:黄彬王绍蔚彭羽莎曾素芬陈宇阳黄绍正
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1