当前位置: 首页 > 专利查询>深圳大学专利>正文

知识库隐私保护方法、装置、终端设备以及存储介质制造方法及图纸

技术编号:41450982 阅读:14 留言:0更新日期:2024-05-28 20:40
本发明专利技术公开了一种知识库隐私保护方法、装置、终端设备以及存储介质,通过响应于接收到用户输入的问题,在预设的向量数据库中对问题进行相似度查询,得到目标文本;若问题或目标文本中包含隐私数据,则对隐私数据进行匿名化处理,得到匿名处理后的问题与文本;将匿名处理后的问题与文本提交至大语言模型,得到特定格式回答;对特定格式回答进行去匿名化处理,得到第一目标回答,并将第一目标回答输出至所述用户。通过匿名化处理,可以有效保障用户的数据安全,且可以直接采用现有的大语言模型,无需在本地重新部署,节约部署成本及时间;通过与匿名化处理对应的去匿名化处理,确保回答的准确还原,改善了针对个人知识库的大语言模型的回答效果。

【技术实现步骤摘要】

本专利技术涉及智能问答,尤其涉及一种知识库隐私保护方法、装置、终端设备以及存储介质


技术介绍

1、随着大型语言模型技术的飞速发展,市场上涌现了众多创新应用。这些大型模型虽然在通用领域方面表现卓越,但它们在训练过程中使用的训练数据有限。为了弥补训练时的知识缺口,私人知识库的应用应运而生。它们通过在用户提问时引入用户自己的知识库内容作为模型回答问题的背景知识,从而使得大语言模型获得它所不具备的背景知识。然而这种创新同时也引发了新的问题,尤其是关于用户隐私的担忧,用户将个人知识库的信息提交给这些第三方模型可能存在安全风险。

2、现有技术中为解决个人知识库的安全风险问题,通常采用本地部署大语言模型或通过k-匿名、差分隐私算法混淆敏感数据,但此类方法容易导致大语言模型的回答效果较差。

3、因此,有必要提出一种改善针对个人知识库的大语言模型的回答效果的解决方案。

4、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本专利技术的主要目的在本文档来自技高网...

【技术保护点】

1.一种知识库隐私保护方法,其特征在于,所述知识库隐私保护方法包括以下步骤:

2.如权利要求1所述的知识库隐私保护方法,其特征在于,所述响应于接收到用户输入的问题,在预设的向量数据库中对所述问题进行相似度查询,得到目标文本的步骤之前还包括:

3.如权利要求1所述的知识库隐私保护方法,其特征在于,所述若所述问题和/或目标文本中包含隐私数据,则对所述隐私数据进行匿名化处理,得到匿名处理后的问题与文本的步骤之前还包括:

4.如权利要求1所述的知识库隐私保护方法,其特征在于,所述对所述隐私数据进行匿名化处理,得到匿名处理后的问题与文本的步骤包括:

...

【技术特征摘要】

1.一种知识库隐私保护方法,其特征在于,所述知识库隐私保护方法包括以下步骤:

2.如权利要求1所述的知识库隐私保护方法,其特征在于,所述响应于接收到用户输入的问题,在预设的向量数据库中对所述问题进行相似度查询,得到目标文本的步骤之前还包括:

3.如权利要求1所述的知识库隐私保护方法,其特征在于,所述若所述问题和/或目标文本中包含隐私数据,则对所述隐私数据进行匿名化处理,得到匿名处理后的问题与文本的步骤之前还包括:

4.如权利要求1所述的知识库隐私保护方法,其特征在于,所述对所述隐私数据进行匿名化处理,得到匿名处理后的问题与文本的步骤包括:

5.如权利要求4所述的知识库隐私保护方法,其特征在于,所述识别所述隐私数据中的命名实体的步骤包括:

6.如权利要求5所述的知识库隐私...

【专利技术属性】
技术研发人员:张胜利但鹏宇
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1