基于数据脱敏的生成式问答方法、装置、设备及介质制造方法及图纸

技术编号：41211632 阅读：2 留言：0更新日期：2024-05-09 23:34

本申请公开了一种基于数据脱敏的生成式问答方法、装置、设备及介质，涉及数据安全技术领域，应用于烧录在预设安全硬件的预设围栏工具，包括：接收当前问题数据对应的当前答案数据，并向生成式模型发送第一判断指令；接收生成式模型针对第一判断指令反馈的第一答复信息；若第一答复信息表征当前问题数据中存在敏感数据，则删除当前答案数据中的敏感数据，得到下一答案数据，并将下一答案数据更新为当前答案数据，然后重新跳转至接收生成式模型反馈的与当前问题数据对应的当前答案数据的步骤；若第一答复信息表征当前问题数据中不存在敏感数据，则将当前答案数据确定为目标答案数据，显示目标答案数据。能够更加安全可靠、低成本的进行生成式问答。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据安全，特别涉及基于数据脱敏的生成式问答方法、装置、设备及介质。

技术介绍

1、生成式模型在进行训练时，训练样本中包含许多敏感数据，非法用户极有可能通过向生成式模型提问的方式获取到敏感数据，造成敏感数据的泄露，敏感数据中包括个人身份信息、健康记录、财务数据等，是可能对个人或组织造成重大影响的数据。这些数据的泄露或滥用可能会导致严重的后果，如经济损失、法律问题和声誉损害等。

2、现有通过nemo guardrails等围栏技术来对模型的输出进行一定的限制，但是现目前只能实现对预设的单词或短语的过滤，而敏感数据是实时变化和更新，需要对围栏也进行实时更新，工作量较大；如果围栏的数据泄漏了，意味着全部敏感数据都泄漏了，一定程度来说，围栏软件带来了更高的风险。

3、综上可见，如何更加安全可靠、低成本的进行生成式问答是本领域有待解决的问题。

技术实现思路

1、有鉴于此，本专利技术的目的在于提供一种基于数据脱敏的生成式问答方法、装置、设备及介质，能够更加安全可靠、低成本的进行生成式问答。其具体方案如下：

2、第一方面，本申请公开了一种基于数据脱敏的生成式问答方法，应用于烧录在预设安全硬件的预设围栏工具，包括：

3、接收生成式模型反馈的与当前问题数据对应的当前答案数据，并向所述生成式模型发送第一判断指令；

4、接收所述生成式模型针对所述第一判断指令反馈的第一答复信息；

5、若所述第一答复信息表征所述当前问题数据

6、若所述第一答复信息表征所述当前问题数据中不存在敏感数据，则将所述当前答案数据确定为目标答案数据，以便在预设界面中显示所述目标答案数据。

7、可选的，所述向所述生成式模型发送第一判断指令，包括：

8、利用目标敏感数据问题分类模型判断所述当前问题数据中是否涉及敏感数据；

9、若所述当前问题数据中涉及所述敏感数据，则向所述生成式模型发送第一判断指令。

10、可选的，所述利用目标敏感数据问题分类模型判断所述当前问题数据中是否涉及敏感数据之前，还包括：

11、将采集的敏感数据确定为训练数据；

12、利用所述训练数据对初始敏感数据问题分类模型进行训练，以得到训练后敏感数据问题分类模型；

13、对所述训练后敏感数据问题分类模型进行加密，以得到目标敏感数据问题分类模型。

14、可选的，所述预设围栏工具中包含用于对所述目标敏感数据问题分类模型进行解密的目标密钥；

15、所述利用目标敏感数据问题分类模型判断所述当前问题数据中是否涉及敏感数据，包括：

16、利用所述目标密钥对目标敏感数据问题分类模型进行解密，以得到所述训练后敏感数据问题分类模型，然后利用所述训练后敏感数据问题分类模型判断所述当前问题数据中是否存在敏感数据。

17、可选的，所述向所述生成式模型发送第一判断指令，包括：

18、确定当前敏感数据删除次数，并判断所述当前敏感数据删除次数是否大于预设阈值；

19、若所述当前敏感数据删除次数不大于所述预设阈值，则向所述生成式模型发送第一判断指令。

20、可选的，所述将所述当前答案数据确定为目标答案数据，包括：

21、将所述当前答案数据确定为当前脱敏后数据，并向所述生成式模型发送第二判断指令；

22、接收所述生成式模型针对所述第二判断指令反馈的第二答复信息；

23、若所述第二答复信息表征所述当前脱敏后数据中存在不良数据，则删除所述当前脱敏后数据中的所述不良数据，以得到下一脱敏后数据，并将所述下一脱敏后数据确定为当前脱敏后数据，然后重新跳转至所述向所述生成式模型发送第二判断指令的步骤；

24、若所述第二答复信息表征所述当前脱敏后数据中不存在不良数据，则将所述当前答案数据确定为目标答案数据。

25、可选的，所述接收生成式模型反馈的与当前问题数据对应的当前答案数据之前，还包括：

26、通过生成式模型利用检索结果数据生成与当前问题数据对应的初始答案数据，并将所述初始答案数据确定为当前答案数据。

27、第二方面，本申请公开了一种基于数据脱敏的生成式问答装置，应用于烧录在预设安全硬件的预设围栏工具，包括：

28、指令发送模块，用于接收生成式模型反馈的与当前问题数据对应的当前答案数据，并向所述生成式模型发送第一判断指令；

29、信息接收模块，用于接收所述生成式模型针对所述第一判断指令反馈的第一答复信息；

30、第一执行模块，用于若所述第一答复信息表征所述当前问题数据中存在敏感数据，则控制所述生成式模型删除所述当前答案数据中的敏感数据，以得到下一答案数据，并将所述下一答案数据更新为当前答案数据，然后重新跳转至所述接收生成式模型反馈的与当前问题数据对应的当前答案数据的步骤；

31、第二执行模块，用于若所述第一答复信息表征所述当前问题数据中不存在敏感数据，则将所述当前答案数据确定为目标答案数据，以便在预设界面中显示所述目标答案数据。

32、第三方面，本申请公开了一种电子设备，包括：

33、存储器，用于保存计算机程序；

34、处理器，用于执行所述计算机程序，以实现前述公开的基于数据脱敏的生成式问答方法的步骤。

35、第四方面，本申请公开了一种计算机可读存储介质，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现前述公开的基于数据脱敏的生成式问答方法的步骤。

36、本申请有益效果为：本申请应用于烧录在预设安全硬件的预设围栏工具，包括：接收生成式模型反馈的与当前问题数据对应的当前答案数据，并向所述生成式模型发送第一判断指令；接收所述生成式模型针对所述第一判断指令反馈的第一答复信息；若所述第一答复信息表征所述当前问题数据中存在敏感数据，则控制所述生成式模型删除所述当前答案数据中的敏感数据，以得到下一答案数据，并将所述下一答案数据更新为当前答案数据，然后重新跳转至所述接收生成式模型反馈的与当前问题数据对应的当前答案数据的步骤；若所述第一答复信息表征所述当前问题数据中不存在敏感数据，则将所述当前答案数据确定为目标答案数据，以便在预设界面中显示所述目标答案数据。由此可见，本申请的预设围栏工具烧录在预设安全硬件中，如此一来，预设围栏工具不会被复制、擦写，使得敏感数据不会被泄露，更加安全可靠；利用生成式模型判断当前问题数据中是否存在敏感数据，不依赖外部数据的输入，不需要对敏感数据的更新，降低工作量，减少工作成本，自动化程度更高。

本文档来自技高网...

【技术保护点】

1.一种基于数据脱敏的生成式问答方法，其特征在于，应用于烧录在预设安全硬件的预设围栏工具，包括：

2.根据权利要求1所述的基于数据脱敏的生成式问答方法，其特征在于，所述向所述生成式模型发送第一判断指令，包括：

3.根据权利要求2所述的基于数据脱敏的生成式问答方法，其特征在于，所述利用目标敏感数据问题分类模型判断所述当前问题数据中是否涉及敏感数据之前，还包括：

4.根据权利要求3所述的基于数据脱敏的生成式问答方法，其特征在于，所述预设围栏工具中包含用于对所述目标敏感数据问题分类模型进行解密的目标密钥；

5.根据权利要求1所述的基于数据脱敏的生成式问答方法，其特征在于，所述向所述生成式模型发送第一判断指令，包括：

6.根据权利要求1至5任一项所述的基于数据脱敏的生成式问答方法，其特征在于，所述将所述当前答案数据确定为目标答案数据，包括：

7.根据权利要求1所述的基于数据脱敏的生成式问答方法，其特征在于，所述接收生成式模型反馈的与当前问题数据对应的当前答案数据之前，还包括：

8.一种基于数据脱敏的生成式

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于数据脱敏的生成式问答方法的步骤。

...

【技术特征摘要】

1.一种基于数据脱敏的生成式问答方法，其特征在于，应用于烧录在预设安全硬件的预设围栏工具，包括：

2.根据权利要求1所述的基于数据脱敏的生成式问答方法，其特征在于，所述向所述生成式模型发送第一判断指令，包括：

5.根据权利要求1所述的基于数据脱敏的生成式问答方法，其特征在于，所述向所述生成式模型发送第...

【专利技术属性】
技术研发人员：唐凯歌，吴杰，齐伟钢，
申请(专利权)人：中电科网络安全科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人