基于LLM的复杂数据库查询的方法、装置、设备和存储介质制造方法及图纸

技术编号:43828583 阅读:36 留言:0更新日期:2024-12-31 18:28
本发明专利技术提供一种基于LLM的复杂数据库查询的方法、装置、设备和存储介质;所述方法包括获取数据库信息,所述数据库信息包括表结构、索引和表关联关系;将数据库信息向量化;遍历数据库中的所有表,基于当前表的表关联关系,为每个表构建最小邻接矩阵,得到最小邻接矩阵集合;接收用户的自然语言问题,对自然语言问题向量化,得到问题向量;遍历数据库中的所有表,根据问题向量与表向量的关联度,选取与问题直接关联的表;得到直接关联表集合;再得到间接关联表集合;最后得到与问题相关联的关联表集合、与问题相关联的表字段集合;构造prompt提示词,与LLM交互,生成SQL查询语句。可提高SQL查询语句的准确性,降低LLM的输入token数量。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其是一种基于llm的复杂数据库查询的方法、装置、设备和存储介质。


技术介绍

1、随着llm(大语言模型)如gpt-4等在自然语言理解和生成方面取得了显著进步,llm具备了强大的上下文理解和生成能力,能够处理复杂的自然语言查询,并将自然语言转换为sql查询语句,执行数据库查询操作。但因数据库表结构复杂和llm可接收token(指文本的最小处理单位)数量有限,导致数据库查询准确性较低。这种限制主要表现在几个方面;首先,复杂的数据库表结构意味着多表关联分析,以及对大量字段和记录的处理;由于表结构复杂,llm无法充分理解所有表之间的关联关系,从而生成不精确的sql查询语句。此外,llm处理的token数量有限,意味着llm的知识注入量被限制,如果用户提问问题和表结构上文过长,超出llm模型最大注入量,导致模型知识注入不完整或被截断。llm处理复杂查询或复杂数据库时,以上两种情况易影响生成sql查询语句的准确性。

2、中国专利申请cn118260327a提出一种自然语言的处理方法、装置、设备、介质和程序产品;首先将用户输入的本文档来自技高网...

【技术保护点】

1.一种基于LLM的复杂数据库查询的方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于LLM的复杂数据库查询的方法,其特征在于,

3.如权利要求1所述的基于LLM的复杂数据库查询的方法,其特征在于,

4.如权利要求3所述的基于LLM的复杂数据库查询的方法,其特征在于,

5.如权利要求1所述的基于LLM的复杂数据库查询的方法,其特征在于,

6.如权利要求1所述的基于LLM的复杂数据库查询的方法,其特征在于,

7.如权利要求1所述的基于LLM的复杂数据库查询的方法,其特征在于,

8.一种基于LLM的...

【技术特征摘要】

1.一种基于llm的复杂数据库查询的方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于llm的复杂数据库查询的方法,其特征在于,

3.如权利要求1所述的基于llm的复杂数据库查询的方法,其特征在于,

4.如权利要求3所述的基于llm的复杂数据库查询的方法,其特征在于,

5.如权利要求1所述的基于llm的复杂数据库查询的...

【专利技术属性】
技术研发人员:丛培强白伟锋
申请(专利权)人:无锡唯因特数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1