一种基于大语言模型的SQL语句生成方法及设备技术

技术编号:43705301 阅读:49 留言:0更新日期:2024-12-18 21:17
本申请涉及自然语言处理技术领域,尤其涉及一种基于大语言模型的SQL语句生成方法及设备。将待转换文本、第一提示文本和第二提示文本拼接后输入到大语言模型,使大语言模型根据第一提示文本的提示基于待转换文本生成候选SQL语句,根据第二提示文本的提示对待转换文本在数据表中所涉及数据表名和字段信息进行分析,得到目标数据表名和目标字段信息,通过比较基于待转换文本分析出来的目标数据表名和目标字段信息,与候选SQL语句的第一数据表名和第一字段信息是否匹配,确定候选SQL语句是否正确,提高了SQL语句生成的准确率,且无需多次调用大语言模型,提高了SQL语句生成的效率。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种基于大语言模型的sql语句生成方法及设备。


技术介绍

1、随着基于transformer解码器变体的模型的快速发展,大语言模型(largelanguage model,llm)正逐步替代传统的自然语言模型,并在实际应用获得了不错的成果。对于文本转换sql(text2sql)任务有基于提示工程的方法及基于微调的方法。在实际场景应用中,经过微调训练的大语言模型虽然可以生成较为准确的结构化查询语言(structured query language,sql)语句,但是仍不能够满足实际应用的要求。

2、相关技术中,基于思维链(chain-of-thought,cot)的text2sql优化方法能够起到提升准确率,目前主要方法包括两种。

3、一种是传统cot的方式,即预先配置不同的转化规则,大语言模型基于该转化规则生成文本对应的sql语句。但是由于文本描述的方式多种多样,预先配置的转化规则无法涵盖所有情况,在转化生成sql语句的过程中很容易产生错误。

4、另一种是从简到繁的方式,即将用户的问题文本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的SQL语句生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选SQL语句、目标数据表名和目标字段信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选SQL语句的过程包括:

4.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选SQL语句的过程包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选SQL语句、目标数据表名和目标字段信息之前,所述方法还包括...

【技术特征摘要】

1.一种基于大语言模型的sql语句生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选sql语句、目标数据表名和目标字段信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选sql语句的过程包括:

4.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选sql语句的过程包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选sql语句、目标数据表名和目标字段信息之前,所述方法还包括:

6.根据权利要求5所述的...

【专利技术属性】
技术研发人员:王月岭刘鹏孟卫明王彦芳张建刘微
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1