【技术实现步骤摘要】
一种自适应规则引导的大语言模型生成SQL系统
[0001]本专利技术涉及数据库管理及应用领域,尤其涉及一种自适应规则引导的大语言模型生成
SQL
(
Structured Query Language
,结构化查询语言)系统
。
技术介绍
[0002]在数字化转型的大潮中,越来越多的业务和数据被上传到数据库中
。
如何对数据库进行使用和管理,对未掌握数据库技术相关知识的非技术人员形成挑战
。NL2SQL
(自然语言转结构化查询语言,
Natural Language to Structured Query Language
)技术可以在几秒钟内将自然语言查询转换为
SQL
查询,大大提高了查询效率
。
用户可以使用自然语言进行查询,而无需了解
SQL
语言的细节
。
这使得查询变得更加简单
、
直观和易于使用,提高了用户的满意度和体验
。
准确地编写
SQL
查询需要对数据库结构有深入的理解
。
但是,许多人不具备这种专业知识,因此可能会出现错误或缺乏完整性的查询
。NL2SQL
技术可以修正这些错误,从而能帮助非技术人员快速掌握数据库使用技术,极大降低学习成本
。
但是当前
NL2SQL
技术并不完善,生成
SQL
语句精度不理想
...
【技术保护点】
【技术特征摘要】
1.
一种自适应规则引导的大语言模型生成
SQL
系统,其特征在于,包括:表结构构建模块
、
参考规则库构建模块
、
常用规则库
、
自适应规则构建模块
、
规则引导
SQL
生成模块;所述表结构构建模块用于列名标准化和列名字典构建,所述列名字典构建指将表名
、
列名和列数据类型合并转换为字典类型数据;所述列名标准化是对数据库中列名
、
表名的不规范形式进行的规范化处理;所述参考规则库构建模块,用于通过分析
SQL
生成机制以及
SQL
语法构建参考规则库,根据
SQL
生成步骤,所述参考规则库构建模块划分为以下子模块:表和列名筛选子模块
、
列条件抽取子模块
、
合并表嵌套子模块
、SQL
片段生成子模块
、
校验子模块;所述常用规则库中包含实际业务场景中常用的
Text
到
SQL
的各个步骤和推理逻辑;所述自适应规则构建模块用于根据输入的
Text
查询语句,结合常用规则库,构建与
Text
查询语句匹配的自适应规则;所述规则引导
SQL
生成模块的输入为当前查询
Text
以及所述自适应规则,根据自适应规则,引导大语言模型逐步生成
SQL
语句
。2.
根据权利要求1所述的自适应规则引导的大语言模型生成
SQL
系统,其特征在于,还包括可视化结果展示模块,用于将根据输入的查询语句得到的数据表
、
各个模块生成的
SQL
片段
、
规则引导
SQL
生成模块生成的完整的
SQL
进行可视化显示
。3.
根据权利要求1所述的自适应规则引导的大语言模型生成
SQL
系统,其特征在于,所述表结构构建模块中,通过翻译工具进行列名标准化,所述翻译工具包括多语种词典
、
行业标准用语及手动总结的词汇映射表格,将列名非中文
、
不规范的表述转写为中文标准表述
。4.
根据权利要求1所述的自适应规则引导的大语言模型生成
SQL
系统,其特征在于,所述表和列名筛选子模块用于筛选使用的表和列名,具体为:根据用户输入的查询语句
Text
,通过大语言模型的匹配能力,选择数据库中对应的表和列;所述列条件抽取子模块用于提取查询语句
Text
的查询需求中针对各列的具体条件,具体是:使用大语言模型的语义理解能力,将
Text
中的查询需求转换为
SQL
的运算符
。5.
根据权利要求1所述的自适应规则引导的大语言模型生成
SQL
系统,其特征在于,所述合并表嵌套子模块用于在需要时合并表,并找出表之间的关联列名,具体是:基于大语言模型的上下文理解能力,判断筛选出的列条件是否需要跨表,并结合表结构知识,推理出合并表的
SQL
命令
。...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。