基于背景知识增强的SQL生成方法、装置、设备及介质制造方法及图纸

技术编号:39979043 阅读:38 留言:0更新日期:2024-01-09 01:23
本发明专利技术公开了一种基于背景知识增强的SQL生成方法、装置、设备及介质。该方法包括:获取待回答问题,并从背景知识库中匹配待回答问题对应的初始背景知识;待回答问题为自然语言文本;根据初始背景知识和待回答问题生成第一提示信息;将第一提示信息输入背景知识提取大语言模型,获得目标背景知识;根据目标背景知识和待回答问题生成第二提示信息;第二提示信息输入语句生成大语言模型,获得SQL语句,能够对语句生成大语言模型进行精确的背景知识增强,降低了无关知识出现的可能性,同时帮助语句生成大语言模型更好的理解任务需求以及解决问题的方法,从而提高了NL2SQL大语言模型的任务解决准确率,并且流程简单易实现。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种基于背景知识增强的sql生成方法、装置、设备及介质。


技术介绍

1、nl2sql是一种将自然语言文本转换为结构化查询语言(structured querylanguage,sql)的技术,旨在使普通用户能够使用自然语言来查询数据库。随着人工智能和自然语言处理技术的不断发展,nl2sql技术也得到快速发展。

2、为了提高nl2sql大语言模型能力,使大模型技术在专业领域的应用效果得到有效提升,需要对nl2sql大语言模型进行背景知识增强。目前,常用的背景知识增强方法主要有:(1)将知识图谱与模型结合,可以帮助模型更好地理解查询中的实体和它们之间的关系,但是知识图谱的实现门槛较高,流程复杂;(2)采用bert、gpt等预训练模型在大量的文本数据上进行预训练。预训练模型通常需要大量计算资源,同时具有不透明性,其决策过程难以解释。(3)数据库的模式(如表名、列名等)是理解sql查询的关键。通过将模式信息嵌入到模型中,帮助模型更好地理解和生成sql查询。但是此方法较为复杂,需要为每个数据库设计特定的模式嵌入。...

【技术保护点】

1.一种基于背景知识增强的SQL生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述从背景知识库中匹配所述待回答问题对应的初始背景知识,包括:

3.根据权利要求1或2所述的方法,其特征在于,根据所述目标背景知识和所述待回答问题生成第二提示信息;

4.根据权利要求1或2所述的方法,其特征在于,根据所述目标背景知识和所述待回答问题生成第二提示信息,包括:

5.根据权利要求1所述的方法,其特征在于,在从背景知识库中匹配所述待回答问题对应的初始背景知识之前还包括:

6.根据权利要求5所述的方法,其特征在于,其中,...

【技术特征摘要】

1.一种基于背景知识增强的sql生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述从背景知识库中匹配所述待回答问题对应的初始背景知识,包括:

3.根据权利要求1或2所述的方法,其特征在于,根据所述目标背景知识和所述待回答问题生成第二提示信息;

4.根据权利要求1或2所述的方法,其特征在于,根据所述目标背景知识和所述待回答问题生成第二提示信息,包括:

5.根据权利要求1所述的方法,其特征在于,在从背景知识库中匹配所述待回答问题对应的初始背景知识之前还包括:

6.根据权利要求5所述的方法,其特征在于,其中,所述属性信息包括:所述背景知识的使用条件和知识类型...

【专利技术属性】
技术研发人员:范豪钧罗中岩黄珈菘夏正勋
申请(专利权)人:星环信息科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1