大模型生成方法、装置、计算机程序产品制造方法及图纸

技术编号:42354047 阅读:23 留言:0更新日期:2024-08-16 14:40
本申请公开了一种大模型生成方法、装置、计算机程序产品。其中,该方法包括:获取自然语言目标问句,并确定自然语言目标问句内的至少一个关键词;利用预设的知识图谱确定各个关键词的要素和要素的属性信息,并由各个关键词的要素和要素的属性信息生成初始SQL语句;确定预设的语料库内的自然语言样例问句与自然语言目标问句或语料库内的样例SQL语句与初始SQL语句的相似度,并基于相似度确定至少一组目标问答对;利用至少一组目标问答对作为提示工程对预设的初始大模型进行训练,得到目标大模型。本申请解决了相关技术采用关键词识别、维护SQL语句模板等方法对自然语言文本进行语义分析,导致SQL预测准确率较低的技术问题。

【技术实现步骤摘要】

本申请涉及大模型生成,具体而言,涉及一种大模型生成方法、装置、计算机程序产品


技术介绍

1、text2sql是一项将用户的自然语言文本(text)转换成可与数据库交互的sql(structured query language,结构化查询语言)的技术,也成为nl2sql。这种技术可以大大改善用户与数据库之间的交互方式,让用户可以通过运行sql语句方便地获取所查询的数据。

2、目前,相关技术人员大都采用关键词识别、维护sql语句模板等传统方法对自然语言进行语义分析,以得到sql语句,但这种方法存在如下问题:数据库信息与自然语言目标问句难以准确匹配;现有sql语句模版更新成本高,难以匹配自然语言表达的多样性。因此传统方法处理text2sql的准确率不高,

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种大模型生成方法、装置、计算机程序产品,以至少解决相关技术采用关键词识别、维护sql语句模板等方法对自然语言文本进行语义分析,导致sql预测准确率较本文档来自技高网...

【技术保护点】

1.一种大模型生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,利用预设的知识图谱确定各个所述关键词的要素和所述要素的属性信息,并由各个所述关键词的要素和所述要素的属性信息生成初始SQL语句,包括:

4.根据权利要求1所述的方法,其特征在于,在确定预设的语料库内的自然语言样例问句与所述自然语言目标问句或所述语料库内的样例SQL语句与所述初始SQL语句的相似度之前,所述方法包括:

5.根据权利要求4所述的方法,其特征在于,确定预设的语料库内的自然语言样例问句与所述自然语言目标问...

【技术特征摘要】

1.一种大模型生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,利用预设的知识图谱确定各个所述关键词的要素和所述要素的属性信息,并由各个所述关键词的要素和所述要素的属性信息生成初始sql语句,包括:

4.根据权利要求1所述的方法,其特征在于,在确定预设的语料库内的自然语言样例问句与所述自然语言目标问句或所述语料库内的样例sql语句与所述初始sql语句的相似度之前,所述方法包括:

5.根据权利要求4所述的方法,其特征在于,确定预设的语料库内的自然语言样例问句与所述自然语言目标问句或所述语料库内的样...

【专利技术属性】
技术研发人员:范潇边江涛白桦
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1