System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型的数据库使用方法和电子设备技术_技高网

一种基于大语言模型的数据库使用方法和电子设备技术

技术编号:41272826 阅读:6 留言:0更新日期:2024-05-11 09:26
本申请公开一种基于大语言模型的数据库使用方法和电子设备,其中方法包括:获得用户对数据库的原始查询语句;基于原始查询语句生成第一查询请求,第一查询请求包括对原始查询语句和目标数据结构进行脱敏所得的已脱敏查询语句和已脱敏目标数据结构,目标数据结构为原始查询语句在数据库中待查询的数据表的数据结构;利用大语言模型对第一查询请求进行语言转换,得到结构化查询语言形式的第二查询请求;对第二查询请求执行向数据库的传输处理,以使数据库进行数据查询,得到结构化查询语言形式的第一查询结果;利用大语言模型对脱敏后的第一查询结果进行语言转换,得到自然语言形式的第二查询结果,向用户返回已恢复敏感数据的第二查询结果。

【技术实现步骤摘要】

本申请属于数据安全与人工智能,尤其涉及一种基于大语言模型的数据库使用方法和电子设备


技术介绍

1、随着大语言模型(large language model,llm)的逐渐普及,基于自然语言的聊天机器人得到快速发展,用户可以使用自然语言和聊天机器人互动,进而完成某些特定任务。其中,调用/使用数据库是较为常见并有实际价值的一类任务,借助于llm,用户可使用自然语言通过聊天机器人实现对数据库的调用/使用,然而,在该过程中,部署在外部的llm服务会导致数据库的数据及数据结构等敏感信息出域,从而带来了安全隐患。


技术实现思路

1、为此,本申请公开如下技术方案:

2、一种基于大语言模型的数据库使用方法,包括:

3、获得用户对数据库的原始查询语句,所述原始查询语句为自然语言形式;

4、基于所述原始查询语句生成第一查询请求,所述第一查询请求包括分别对所述原始查询语句和目标数据结构进行脱敏后所得的已脱敏查询语句和已脱敏目标数据结构,所述目标数据结构为所述原始查询语句在所述数据库中待查询的数据表的数据结构;

5、利用大语言模型对所述第一查询请求进行语言转换处理,得到结构化查询语言形式的第二查询请求;

6、对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果;

7、利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理,得到自然语言形式的第二查询结果,向用户返回已恢复敏感数据的第二查询结果。

8、可选的,基于所述原始查询语句生成第一查询请求,包括:

9、将所述原始查询语句中的敏感数据转换为对应的匿名化数据,得到所述已脱敏查询语句;

10、获得将所述目标数据结构中的敏感数据转换为对应的匿名化数据后所得的所述已脱敏目标数据结构;

11、利用预设的第一提示词模板,将所述已脱敏查询语句和所述已脱敏目标数据结构封装为所述大语言模型的输入数据格式,得到所述第一查询请求。

12、可选的,在对所述第二查询请求执行向所述数据库的传输处理之前,所述方法还包括:

13、将所述第二查询请求中非敏感的匿名化数据恢复为对应的敏感数据;

14、其中,所述第二查询请求中非敏感的匿名化数据为所述大语言模型基于对所述第一查询请求中非敏感的匿名化数据进行语言转换处理所得的数据,所述第一查询请求中非敏感的匿名化数据包括对所述原始查询语句和所述目标数据结构分别进行脱敏所得的匿名化数据。

15、可选的,对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果,包括:

16、将恢复敏感数据后的第二查询请求发送至所述数据库,以使所述数据库基于所述恢复敏感数据后的第二查询请求对所述数据库的相应原始数据表进行查询,得到所述数据库返回的结构化查询语言形式的第一子查询结果;

17、其中,所述第一查询结果为所述第一子查询结果,所述第一子查询结果包含所述数据库的相应敏感信息。

18、可选的,在利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理之前,所述方法还包括:

19、将所述第一查询结果中的敏感数据转换为对应的匿名化数据,得到脱敏后的第一查询结果;

20、利用预设的第二提示词模板将所述脱敏后的第一查询结果封装为所述大语言模型的输入数据格式,得到对所述脱敏后的第一查询结果的封装结果;

21、所述利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理,包括:

22、利用所述大语言模型对所述脱敏后的第一查询结果的封装结果进行语言转换处理。

23、可选的,对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果,包括:

24、将所述第二查询请求发送至所述数据库,以使所述数据库基于所述第二查询请求对所述数据库的脱敏后的相应数据表进行查询,得到所述数据库返回的结构化查询语言形式的第二子查询结果;

25、其中,所述第一查询结果为所述第二子查询结果,所述第二子查询结果未包含所述数据库的敏感信息。

26、可选的,所述脱敏后的第一查询结果为所述第一查询结果;在利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理之前,所述方法还包括:

27、利用预设的第二提示词模板将所述第一查询结果封装为所述大语言模型的输入数据格式,得到对所述第一查询结果的封装结果;

28、利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理,包括:

29、利用所述大语言模型对所述第一查询结果的封装结果进行语言转换处理。

30、可选的,在向用户返回已恢复敏感数据的第二查询结果之前,所述方法还包括:

31、将所述大语言模型输出的第二查询结果中的匿名化数据恢复为对应的敏感数据,得到所述已恢复敏感数据的第二查询结果。

32、可选的,在获得用户对数据库的原始查询语句之前,所述方法还包括:

33、将所述数据库中的数据表所对应数据结构中的敏感数据转换为对应的匿名化数据,以对所述数据库中的数据表所对应的数据结构进行脱敏。

34、一种电子设备,包括:

35、存储器,用于至少存储一组计算机指令集;

36、处理器,用于通过执行所述存储器中存储的所述指令集,实现如上文任一项所述的基于大语言模型的数据库使用方法。

37、由以上方案可知,本申请公开一种基于大语言模型的数据库使用方法和电子设备,其中方法包括:获得用户对数据库的原始查询语句,所述原始查询语句为自然语言形式;基于所述原始查询语句生成第一查询请求,所述第一查询请求包括分别对所述原始查询语句和目标数据结构进行脱敏后所得的已脱敏查询语句和已脱敏目标数据结构,所述目标数据结构为所述原始查询语句在所述数据库中待查询的数据表的数据结构;利用大语言模型对所述第一查询请求进行语言转换处理,得到结构化查询语言形式的第二查询请求;对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果;利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理,得到自然语言形式的第二查询结果,向用户返回已恢复敏感数据的第二查询结果。

38、针对用户使用自然语言,借助大语言模型调用/使用数据库的场景,本申请在利用大语言模型对查询请求、查询结果等数据进行语言转换处理之前,首先对查询请求、查询结果等数据进行了脱敏,使得在数据提交到大语言模型之前将其敏感数据隐藏,保证了大语言模型处理的数据未包含敏感数据,从而避免了用户/数据库的数据或数据结构等敏感信息出域,消除了该应用场景中的数据安全隐患,保证了数据安全。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的数据库使用方法,包括:

2.根据权利要求1所述的基于大语言模型的数据库使用方法,基于所述原始查询语句生成第一查询请求,包括:

3.根据权利要求1所述的基于大语言模型的数据库使用方法,在对所述第二查询请求执行向所述数据库的传输处理之前,还包括:

4.根据权利要求3所述的基于大语言模型的数据库使用方法,对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果,包括:

5.根据权利要求3所述的基于大语言模型的数据库使用方法,在利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理之前,还包括:

6.根据权利要求1所述的基于大语言模型的数据库使用方法,对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果,包括:

7.根据权利要求6所述的基于大语言模型的数据库使用方法,所述脱敏后的第一查询结果为所述第一查询结果;在利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理之前,还包括:

8.根据权利要求1所述的基于大语言模型的数据库使用方法,在向用户返回已恢复敏感数据的第二查询结果之前,还包括:

9.根据权利要求1所述的基于大语言模型的数据库使用方法,在获得用户对数据库的原始查询语句之前,还包括:

10.一种电子设备,包括:

...

【技术特征摘要】

1.一种基于大语言模型的数据库使用方法,包括:

2.根据权利要求1所述的基于大语言模型的数据库使用方法,基于所述原始查询语句生成第一查询请求,包括:

3.根据权利要求1所述的基于大语言模型的数据库使用方法,在对所述第二查询请求执行向所述数据库的传输处理之前,还包括:

4.根据权利要求3所述的基于大语言模型的数据库使用方法,对所述第二查询请求执行向所述数据库的传输处理,以使所述数据库进行数据查询,得到所述数据库返回的结构化查询语言形式的第一查询结果,包括:

5.根据权利要求3所述的基于大语言模型的数据库使用方法,在利用所述大语言模型对脱敏后的第一查询结果进行语言转换处理之前,还包括:

6....

【专利技术属性】
技术研发人员:马逸龙路逊
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1