【技术实现步骤摘要】
本申请涉及自然语言处理,尤其涉及一种基于大语言模型的sql语句生成方法及设备。
技术介绍
1、随着基于transformer解码器变体的模型的快速发展,大语言模型(largelanguage model,llm)正逐步替代传统的自然语言模型,并在实际应用获得了不错的成果。对于文本转换sql(text2sql)任务有基于提示工程的方法及基于微调的方法。在实际场景应用中,经过微调训练的大语言模型虽然可以生成较为准确的结构化查询语言(structured query language,sql)语句,但是仍不能够满足实际应用的要求。
2、相关技术中,基于思维链(chain-of-thought,cot)的text2sql优化方法能够起到提升准确率,目前主要方法包括两种。
3、一种是传统cot的方式,即预先配置不同的转化规则,大语言模型基于该转化规则生成文本对应的sql语句。但是由于文本描述的方式多种多样,预先配置的转化规则无法涵盖所有情况,在转化生成sql语句的过程中很容易产生错误。
4、另一种是从简到繁的方
...【技术保护点】
1.一种基于大语言模型的SQL语句生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选SQL语句、目标数据表名和目标字段信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选SQL语句的过程包括:
4.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选SQL语句的过程包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选SQL语句、目标数据表名和目标字段信息
...【技术特征摘要】
1.一种基于大语言模型的sql语句生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选sql语句、目标数据表名和目标字段信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选sql语句的过程包括:
4.根据权利要求2所述的方法,其特征在于,所述大语言模型得到所述候选sql语句的过程包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述输入文本输入到所述大语言模型中,得到候选sql语句、目标数据表名和目标字段信息之前,所述方法还包括:
6.根据权利要求5所述的...
【专利技术属性】
技术研发人员:王月岭,刘鹏,孟卫明,王彦芳,张建,刘微,
申请(专利权)人:海信集团控股股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。