【技术实现步骤摘要】
本专利技术涉及text to sql生成(t2s)的,特别是涉及一种基于大语言模型的sql生成的零训练方法。
技术介绍
1、传统的编写sql查询代码需要用户具备sql语法知识,并熟悉数据库的结构,这对普通的用户形成了门槛。基于llm的t2s技术,通过将用户的自然语言需求直接转化为sql查询语句,极大地简化了用户与数据库的交互。基于llm的t2s通常包括几个关键步骤:首先,根据用户的数据微调大语言模型;然后,模型接收用户的自然语言问询(如“查2022年所有站点的发电量”);最后,模型根据用户的自然语言问询和数据库ddl,生成相应的sql查询语句。
2、在能源管理系统(energy management system,ems)行业,应用llm生成准确的sql有两个关键瓶颈:
3、1、用户的数据库分散、凌乱,标准不统一,一个数据库可能包含上千个表,大语言模型难以准确理解上千个表之间的关系,生成正确sql的精确率相当低。
4、2、用户问询和数据库中包含很多的特定的设备专有名词,大语言模型可能没有见过这些专有名
...【技术保护点】
1.一种基于大语言模型的SQL生成的零训练方法,其特征在于:所述方法包括离线部分和在线部分;
2.根据权利要求1所述的一种基于大语言模型的SQL生成的零训练方法,其特征在于,所述步骤1中将不同用户千变万化的数据库抽取、转换、加载,重构为具有EMS行业背景的精简的少量的标准数据库表,即“EMS标准数据库”;所述EMS标准数据库,基于EMS多个用户的实际业务需求,从头设计了标准的数据库组织结构,并规范化处理了表名、列名和值。
3.根据权利要求1所述的一种基于大语言模型的SQL生成的零训练方法,其特征在于,所述步骤6中通过数据增强和模型微调,提高LL
...【技术特征摘要】
1.一种基于大语言模型的sql生成的零训练方法,其特征在于:所述方法包括离线部分和在线部分;
2.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤1中将不同用户千变万化的数据库抽取、转换、加载,重构为具有ems行业背景的精简的少量的标准数据库表,即“ems标准数据库”;所述ems标准数据库,基于ems多个用户的实际业务需求,从头设计了标准的数据库组织结构,并规范化处理了表名、列名和值。
3.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤6中通过数据增强和模型微调,提高llm对ems行业业务知识和sql查询的基础理解能力;
4.根据权利要求1所述的一种基于大语言模型的sql生成的零训练方法,其特征在于,所述步骤7、步骤8、步骤9和步骤10中,首先使用llm做命名实体识别并做一定的后处理,再和实体库做检索匹配,最后使用检索结果增强llm的sql生成能力,从而大幅提高llm对未训练过的知识的理解,即零训练;关键在于步骤8,即把用户问...
【专利技术属性】
技术研发人员:董其昌,黄诚,张浩,
申请(专利权)人:智子熹源上海科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。