System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据库查询语句的订正方法、系统、电子设备及存储介质技术方案_技高网

数据库查询语句的订正方法、系统、电子设备及存储介质技术方案

技术编号:40557765 阅读:13 留言:0更新日期:2024-03-05 19:19
本申请实施例提供了一种数据库查询语句的订正方法、系统、电子设备及存储介质,涉及数据库查询技术领域,本申请在大语言模型生成查询语句时,通过查询预设数据库,利用预设数据库中正确的限制条件值、限制条件列来对大语言模型生成的查询语句中错误的初始限制条件值、限制条件列进行订正,可以有效提升生成查询语句的准确度,同时提升用户查询数据库的效率。

【技术实现步骤摘要】

本申请涉及数据库查询,特别是一种数据库查询语句的订正方法、系统、电子设备及存储介质


技术介绍

1、目前,对于数据库的查询,大多是采用大型的语音模型进行查询,其中,大型语言模型一般是指包含数十亿至数千亿甚至更多参数的语言模型,这些参数是在大量文本数据基础上训练得到的,例如gpt-3、palm、galactica和llama。这些大语言模型能够更好的理解自然语言,并根据给定的上下文(例如prompt)生成高质量的文本。

2、现有的大语言模型一般都具有查询语句生成能力,即只要给大语言模型一些数据集表格信息的提示或问句,大语言模型就会根据这些提示或问句生成相应的查询语句。

3、但是,由于大语言模型生成查询语句时无法知道数据库的全貌,包括数据库中具体的值,所以在生成查询语句时会包含一些错误,从而无法从数据库中得到用户想要查询的结果。

4、因此,亟需一种数据库查询语句的订正方法。


技术实现思路

1、鉴于上述问题,本申请实施例提供了一种数据库查询语句的订正方法、系统、电子设备及存储介质,以便克服上述问题或者至少部分地解决上述问题。

2、本申请实施例第一方面,提供了一种数据库查询语句的订正方法,所述方法包括:

3、获取大语言模型针对用户输入的自然语言生成的查询语句,并从所述查询语句中筛选出初始限制条件值和初始限制条件列;

4、查询预设数据库中分别与所述初始限制条件值对应的限制条件列,并从所述限制条件列中确定多个候选限制条件值

5、从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,将所述初始限制条件值订正为所述第一目标限制条件值;

6、查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,并从多个所述候选限制条件列中确定出与所述初始限制条件值相匹配的第二目标限制条件值;

7、将所述第一目标限制条件值订正为所述第二目标限制条件值,并将所述初始限制条件列订正为所述第二目标限制条件值对应的候选限制条件列。

8、可选地,所述查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,包括:

9、查询所述预设数据库,并从所述预设数据库中筛选出多个限制条件列;

10、分别计算每个所述限制条件列与所述初始限制条件列的相似度,并判断每个所述限制条件列与所述初始限制条件列的相似度中,是否存在相似度大于等于第一预设相似度的所述限制条件列;

11、若是,则将相似度超过所述第一预设相似度的所述限制条件列确定为所述候选限制条件列;

12、若否,则结束对所述初始限制条件列的订正。

13、可选地,所述从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,包括:

14、分别计算多个所述候选限制条件值与所述初始限制条件值的相似度;

15、将各个所述候选限制条件值与所述初始限制条件值的相似度中,相似度最高的候选限制条件值确定为所述第一目标限制条件值。

16、可选地,所述从多个所述候选限制条件列中确定出与所述初始限制条件值相匹配的第二目标限制条件值,包括:

17、查询各个所述候选限制条件列,并确定每个所述候选限制条件列中的限制条件值;

18、分别计算每个所述候选限制条件列中的各个限制条件值与所述初始限制条件值的相似度,以及所述第一目标限制条件值与所述初始限制条件值的相似度;

19、将各个所述限制条件值与所述初始限制条件值的相似度中,相似度大于所述第一目标限制条件值与所述初始限制条件值的相似度对应的限制条件值确定为所述第二目标限制条件值。

20、可选地,通过预训练的相似度模型将待查询的文本字段分别转化为各自对应的语义向量,所述待查询的文本字段包括:所述预设数据库中筛选出的多个限制条件列、所述初始限制条件列、所述候选限制条件列中的限制条件值、所述初始限制条件值、所述第一目标限制条件值以及所述候选限制条件值。

21、可选地,所述方法还包括:

22、在所述候选限制条件值的数量大于等于预设数量的情况下,计算各个所述候选限制条件值与所述初始限制条件值的字符相似度,并保留所述字符相似度中大于等于预设字符相似度的候选限制条件值。

23、可选地,所述大语言模型针对用户输入的自然语言生成查询语句,包括:

24、对所述自然语言进行解析,并提取出所述自然语言中的特征文本;

25、将所述特征文本填充到预设的查询模板中,得到所述查询语句;

26、所述从所述查询语句中筛选出初始限制条件值和初始限制条件列,包括:

27、对所述查询语句进行解析,得到所述查询语句对应的数据结构;

28、从所述数据结构中筛选出所述初始限制条件值和所述初始限制条件列。

29、本申请实施例第二方面,提供了一种数据库查询语句的订正系统,所述系统包括:

30、获取模块,用于获取大语言模型针对用户输入的自然语言生成的查询语句,并从所述查询语句中筛选出初始限制条件值和初始限制条件列;

31、第一确定模块,用于查询预设数据库中分别与所述初始限制条件值对应的限制条件列,并从所述限制条件列中确定多个候选限制条件值;

32、第一订正模块,用于从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,将所述初始限制条件值订正为所述第一目标限制条件值;

33、第二确定模块,用于查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,并从多个所述候选限制条件列中确定出与所述初始限制条件值相匹配的第二目标限制条件值;

34、第二订正模块,用于将所述第一目标限制条件值订正为所述第二目标限制条件值,并将所述初始限制条件列订正为所述第二目标限制条件值对应的候选限制条件列。

35、可选地,所述查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,包括:

36、第一筛选子模块,用于查询所述预设数据库,并从所述预设数据库中筛选出多个限制条件列;

37、判断子模块,用于分别计算每个所述限制条件列与所述初始限制条件列的相似度,并判断每个所述限制条件列与所述初始限制条件列的相似度中,是否存在相似度大于等于第一预设相似度的所述限制条件列;

38、若是,则将相似度超过所述第一预设相似度的所述限制条件列确定为所述候选限制条件列;

39、若否,则结束对所述初始限制条件列的订正。

40、可选地,所述从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,包括:

41、第一计算子模块,用于分别计算多个所述候选限制条件值与所述初始限制条件值的相似度;

42、第一确定子模块,用于将各个所述候选限制条件值与所述初始限制条件值的本文档来自技高网...

【技术保护点】

1.一种数据库查询语句的订正方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,所述查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,包括:

3.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,所述从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,包括:

4.根据权利要求1或3所述的数据库查询语句的订正方法,其特征在于,所述从多个所述候选限制条件列中确定出与所述初始限制条件值相匹配的第二目标限制条件值,包括:

5.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,通过预训练的相似度模型将待查询的文本字段分别转化为各自对应的语义向量,所述待查询的文本字段包括:所述预设数据库中筛选出的多个限制条件列、所述初始限制条件列、所述候选限制条件列中的限制条件值、所述初始限制条件值、所述第一目标限制条件值以及所述候选限制条件值。

6.根据权利要求4所述的数据库查询语句的订正方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,所述大语言模型针对用户输入的自然语言生成查询语句,包括:

8.一种数据库查询语句的订正系统,其特征在于,所述系统包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1至7中任一项所述的数据库查询语句的订正方法。

10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至7中任一项所述的数据库查询语句的订正方法。

...

【技术特征摘要】

1.一种数据库查询语句的订正方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,所述查询所述预设数据库中与所述初始限制条件列对应的多个候选限制条件列,包括:

3.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,所述从多个所述候选限制条件值中确定与所述初始限制条件值相匹配的第一目标限制条件值,包括:

4.根据权利要求1或3所述的数据库查询语句的订正方法,其特征在于,所述从多个所述候选限制条件列中确定出与所述初始限制条件值相匹配的第二目标限制条件值,包括:

5.根据权利要求1所述的数据库查询语句的订正方法,其特征在于,通过预训练的相似度模型将待查询的文本字段分别转化为各自对应的语义向量,所述待查询的文本字段包括:所述预设数据库中筛选出的多个限制条件列、所述初始限制...

【专利技术属性】
技术研发人员:李天阳邢启洲李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1