基于偏好学习的NL2SQL生成方法、装置、终端及存储介质制造方法及图纸

技术编号:42651706 阅读:36 留言:0更新日期:2024-09-06 01:44
本申请公开了一种基于偏好学习的NL2SQL生成方法、装置、终端及存储介质,方法包括:获取SFT数据;基于SFT数据和多个大型语言模型,构造偏好数据集,其中,多个大型语言模型中的各个大型语言模型的类型不同,再建立SFT模型;基于偏好数据集、SFT模型和直接偏好优化算法,确定目标模型,以基于目标模型生成NL2SQL语句。本发明专利技术构造的偏好数据集无需人工标注,降低了人工成本,还可以达到与人类反馈相似的性能,此外,本发明专利技术还利用直接偏好优化算法对SFT模型进行优化,提升了目标模型的性能,从而提高了生成的NL2SQL的准确度。

【技术实现步骤摘要】

本申请涉及nl2sql生成,具体而言,涉及一种基于偏好学习的nl2sql生成方法、装置、终端及存储介质。


技术介绍

1、nl2sql是指在给定数据库和自然语言的条件下,将自然语言解析成sql语句,并执行sql语句返回查询结果的技术。随着大模型技术的不断发展,nl2sql得到了越来越多的关注,因此,如何生成nl2sql成为亟待解决的问题。

2、目前,主要采用图神经网络或大语言模型生成nl2sql,其普遍依赖于在私有数据集上对开源模型进行有监督微调,从而依赖微调后的模型生成nl2sql。

3、但是,上述方法采用的监督学习所得到的大模型的性能较低,导致所生成的nl2sql准确度低。


技术实现思路

1、本申请的主要目的在于提供一种基于偏好学习的nl2sql生成方法、装置、终端及存储介质,以解决相关技术中生成的nl2sql准确度低的问题。

2、为了实现上述目的,第一方面,本申请提供了一种基于偏好学习的nl2sql生成方法,包括:

3、获取sft数据;</p>

4、基于本文档来自技高网...

【技术保护点】

1.一种基于偏好学习的NL2SQL生成方法,其特征在于,包括:

2.如权利要求1所述基于偏好学习的NL2SQL生成方法,其特征在于,所述基于所述SFT数据和多个大型语言模型,构造偏好数据集,包括:

3.如权利要求2所述基于偏好学习的NL2SQL生成方法,其特征在于,所述从所述多个SQL语句中选取符合预设条件的SQL语句作为目标SQL语句,并由所述目标SQL语句构造所述偏好数据集,包括:

4.如权利要求1所述基于偏好学习的NL2SQL生成方法,其特征在于,所述建立SFT模型,包括:

5.如权利要求1所述基于偏好学习的NL2SQL生成方法,其特...

【技术特征摘要】

1.一种基于偏好学习的nl2sql生成方法,其特征在于,包括:

2.如权利要求1所述基于偏好学习的nl2sql生成方法,其特征在于,所述基于所述sft数据和多个大型语言模型,构造偏好数据集,包括:

3.如权利要求2所述基于偏好学习的nl2sql生成方法,其特征在于,所述从所述多个sql语句中选取符合预设条件的sql语句作为目标sql语句,并由所述目标sql语句构造所述偏好数据集,包括:

4.如权利要求1所述基于偏好学习的nl2sql生成方法,其特征在于,所述建立sft模型,包括:

5.如权利要求1所述基于偏好学习的nl2sql生成方法,其特征在于,所述基于所述偏好数据集、所述sft模型和直接偏好优化算法,确定目标模型,包括:

6.如权利要求5所述基于偏好学习的nl2sql生成方法,其特征在于,所述基于所述响应数据和所述直接偏好优化算法对所...

【专利技术属性】
技术研发人员:房松涛李家诚沙雨辰卢睿轩黄卫航刘东胡光龙
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1