知识检索增强的隐私保护方法及装置、系统、设备、介质制造方法及图纸

技术编号:41973945 阅读:20 留言:0更新日期:2024-07-10 16:52
本说明书实施例公开了一种知识检索增强的隐私保护方法及装置、系统、设备、介质,首先接收用户提问数据,从外接的知识数据库中确定用户提问数据关联的候选上下文数据,并对候选上下文数据进行隐私保护处理,得到目标上下文数据;然后基于用户提问数据和目标上下文数据,生成问答提示数据,并最终将问答提示数据输入到训练好的大语言模型中,得到用户提问数据对应的回答数据。本技术方案能够从数据源头上实现对隐私敏感数据的保护,避免攻击者通过与大语言模型的问题得到数据库中的隐私敏感数据,有效提升隐私敏感数据的安全性。

【技术实现步骤摘要】

本说明书涉及人工智能,尤其涉及一种知识检索增强的隐私保护方法及装置、系统、设备、介质


技术介绍

1、随着科学技术的飞速发展,大语言模型(large language model,llm)越来越受到人们的关注。大语言模型是基于海量文本数据训练的深度学习模型,能够生成自然语言文本或理解语言文本的含义,这类模型可以执行多种自然语言处理(natural languageprocessing,nlp)任务,包括但不限于文本分类、问答和对话等。但是,使用过程中的大语言模型往往存在幻觉现象,即大语言模型的生成结果中的内容可能出现与事实不符的情况,且由于大语言模型的训练知识库的更新频率较低,导致模型所获取的信息往往已经过时,输出结果的准确性与可靠性较低,无法满足实际应用的需求。

2、为了解决该问题,通常是采用外挂知识库的方式为大语言模型提供准确的、最新的数据。但是,外挂知识库中包含大量个人识别隐私信息(比如邮箱、手机号等)和企业内部敏感数据(比如账户密码、财务数据等),导致攻击者通过问答,可能会从大语言模型的输出结果中得到个人识别隐私信息或者企业内部敏感数据本文档来自技高网...

【技术保护点】

1.一种知识检索增强的隐私保护方法,所述方法包括:

2.根据权利要求1所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私保护处理,得到目标上下文数据,包括:

3.根据权利要求2所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行访问权限筛选,得到目标上下文数据,包括:

4.根据权利要求1所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私保护处理,得到目标上下文数据,包括:

5.根据权利要求4所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私数据替换,得到目标上下文数据,包括:

...

【技术特征摘要】

1.一种知识检索增强的隐私保护方法,所述方法包括:

2.根据权利要求1所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私保护处理,得到目标上下文数据,包括:

3.根据权利要求2所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行访问权限筛选,得到目标上下文数据,包括:

4.根据权利要求1所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私保护处理,得到目标上下文数据,包括:

5.根据权利要求4所述的知识检索增强的隐私保护方法,所述对所述候选上下文数据进行隐私数据替换,得到目标上下文数据,包括:

6.根据权利要求1所述的知识检索增强的隐私保护方法,所述从预设的知识检索增强数据库中确定所述用户提问数据关联的候选上下文数据,包括:

7.根据权利要求6所述的知识检索增强的隐私保护方法,所述知识检索增强数据库包括上下文向量数据库;所述根据所述用户提问数据与所述知识检索增强数据库中各上下文数据之间的语义相似度确定所述用户提问数据关...

【专利技术属性】
技术研发人员:刘焱翁海琴
申请(专利权)人:蚂蚁科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1