一种基于大语言模型的SQL生成的零训练方法技术

技术编号:44760418 阅读:25 留言:0更新日期:2025-03-26 12:44
本发明专利技术公开了一种基于大语言模型的SQL生成的零训练方法,包括离线部分和在线部分;且核心技术点有四个:“EMS标准数据库”、数据增强和模型微调、基于命名实体识别的检索增强生成,基于抽象语法树的SQL纠错。本发明专利技术提出了针对众多EMS行业用户的零训练的T2S解决方案;事先用2‑5个用户的数据微调模型,其他众多行业客户,不再需要微调训练,即零训练,只要接入该解决方案,就可以部署精确率高达99%的T2S智能体,从而大幅降低了T2S在EMS行业的落地成本,使数据分析成为普惠的技术,促进更多企业的员工使用自然语言直接查询数据库并自动智能分析数据,为企业的决策提供更快速、更精准、更智能的数据分析依据,降本增效,促进数字经济和实体经济的发展。

【技术实现步骤摘要】

本专利技术涉及text to sql生成(t2s)的,特别是涉及一种基于大语言模型的sql生成的零训练方法。


技术介绍

1、传统的编写sql查询代码需要用户具备sql语法知识,并熟悉数据库的结构,这对普通的用户形成了门槛。基于llm的t2s技术,通过将用户的自然语言需求直接转化为sql查询语句,极大地简化了用户与数据库的交互。基于llm的t2s通常包括几个关键步骤:首先,根据用户的数据微调大语言模型;然后,模型接收用户的自然语言问询(如“查2022年所有站点的发电量”);最后,模型根据用户的自然语言问询和数据库ddl,生成相应的sql查询语句。

2、在能源管理系统(energy management system,ems)行业,应用llm生成准确的sql有两个关键瓶颈:

3、1、用户的数据库分散、凌乱,标准不统一,一个数据库可能包含上千个表,大语言模型难以准确理解上千个表之间的关系,生成正确sql的精确率相当低。

4、2、用户问询和数据库中包含很多的特定的设备专有名词,大语言模型可能没有见过这些专有名词,并且用户问询中可本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的SQL生成的零训练方法,其特征在于:所述方法包括离线部分和在线部分;

2.根据权利要求1所述的一种基于大语言模型的SQL生成的零训练方法,其特征在于,所述步骤1中将不同用户千变万化的数据库抽取、转换、加载,重构为具有EMS行业背景的精简的少量的标准数据库表,即“EMS标准数据库”;所述EMS标准数据库,基于EMS多个用户的实际业务需求,从头设计了标准的数据库组织结构,并规范化处理了表名、列名和值。

3.根据权利要求1所述的一种基于大语言模型的SQL生成的零训练方法,其特征在于,所述步骤6中通过数据增强和模型微调,提高LLM对EMS行业业务知...

【技术特征摘要】

1.一种基于大语言模型的sql生成的零训练方法,其特征在于:所述方法包括离线部分和在线部分;

2.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤1中将不同用户千变万化的数据库抽取、转换、加载,重构为具有ems行业背景的精简的少量的标准数据库表,即“ems标准数据库”;所述ems标准数据库,基于ems多个用户的实际业务需求,从头设计了标准的数据库组织结构,并规范化处理了表名、列名和值。

3.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤6中通过数据增强和模型微调,提高llm对ems行业业务知识和sql查询的基础理解能力;

4.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤7、步骤8、步骤9和步骤10中,首先使用llm做命名实体识别并做一定的后处理,再和实体库做检索匹配,最后使用检索结果增强llm的sql生成能力,从而大幅提高llm对未训练过的知识的理解,即零训练;关键在于步骤8,即把用户问...

【专利技术属性】
技术研发人员:董其昌黄诚张浩
申请(专利权)人:智子熹源上海科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1