一种基于微调大语言模型的自然语言语句转制造技术

技术编号：39738520 阅读：11 留言：0更新日期：2023-12-17 23:40

本发明专利技术属于自然语言处理技术领域，涉及一种基于微调大语言模型的自然语言语句转

全部详细技术资料下载

【技术实现步骤摘要】
一种基于微调大语言模型的自然语言语句转SQL语句方法

[0001]本专利技术属于自然语言处理
，涉及一种自然语言语句转
SQL
语句方法，尤其涉及一种基于微调大语言模型的自然语言语句转
SQL
语句方法
。

技术介绍

[0002]在将自然语言语句转
SQL
语句时，之前常采用深度学习的方法
。
但是，由于传统的深度学习方法不具备通用自然语言理解能力，所以需标注语料多，跨场景能力较弱，灵活性较低，模型部署后，不重新训练的情况下，基本没有可调整的空间
。
[0003]随着人工智能
、
大数据技术的飞速发展，以大语言模型为代表的新一代人工智能技术带来了革命性的突破，如何基于大语言模型对传统的产品和业务进行重构升级是一个火热的研究课题
。
[0004]自然语言语句转
SQL
语句是自然语言处理最热门的研究方向之一
。
人类的自然语言表达方式多样性很大，传统的方法难以很好的应对，而大语言模型具有强大的涌现能力，对于自然语言具备通用的理解能力，跨领域能力和灵活性极高
。
因此，基于大语言模型的自然语言语句转
SQL
语句方法成为热点研究方向
。
[0005]例如，专利公开号为
CN115658729A
的专利技术提出了一种基于预训练模型的自然语言转
SQL
语句的方法，其具体方案如下：

【技术保护点】

【技术特征摘要】
1.
一种基于微调大语言模型的自然语言语句转
SQL
语句方法，其特征在于，包括以下步骤：
1)、
微调训练大语言模型；
2)、
获取待转化的自然语言语句；
3)、
将所述自然语言语句输入微调训练后的大语言模型，得到转化后的
SQL
语句
。2.
根据权利要求1所述的基于微调大语言模型的自然语言语句转
SQL
语句方法，其特征在于，所述步骤
1)
具体包括：
1.1)、
创建自然语言语句转
SQL
语句训练数据集；
1.2)、
使用所述训练数据集对大语言模型进行领域适应微调；
1.3)、
使用所述训练数据集对领域适应微调后的大语言模型进行执行结果反馈对齐微调
。3.
根据权利要求2所述的基于微调大语言模型的自然语言语句转
SQL
语句方法，其特征在于，所述步骤
1.3)
中，在进行执行结果反馈对齐微调时，引入
SQL
可执行性和
SQL
执行结果这2个监督信息约束，这2个监督信息的标签通过执行
SQL
语句获得，标签值为0或1，其中，
SQL
可执行性的标签值为0表示
SQL
执行失败，为1表示
SQL
执行成功；
SQL
执行结果的标签值为0表示
SQL
执行结果错误，为1表示
SQL
执行结果正确，由此，将领域适应微调后的大语言模型的损失函数记为
L
final
，则，
L
final
＝
α1‑
label_execute
*
β1‑
label_result
*L
original
式中，
α1‑
label_...

【专利技术属性】
技术研发人员：刘海波，陈昊，王仿，
申请(专利权)人：北京智谱华章科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人