全链路的自然语言转换为结构化查询语言的方法技术

技术编号:41802898 阅读:34 留言:0更新日期:2024-06-24 20:24
本发明专利技术公开了一种全链路的自然语言转换为结构化查询语言的方法,属于数据处理领域,包括以下步骤:S1、采用现有语料和提示工程预训练开源大语言模型;S2、基于知识图谱构建针对具体应用场景的NL2SQL语料库,获取训练集和测试集;S3、获得最佳开源大语言模型;S4、向最佳开源大语言模型中输入自然语言,查询并生成SQL语句。本发明专利技术采用上述全链路的自然语言转换为结构化查询语言的方法,结合知识图谱的结构化知识和开源大语言模型的强大自然语言处理能力,能够更好地理解查询中的实体和它们之间的关系,从而精准地捕捉用户的查询意图,即使在面对复杂或模糊的查询时也能保持较高的理解准确率。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及全链路的自然语言转换为结构化查询语言的方法


技术介绍

1、nl2sql(natural language to sql),即从自然语言到结构化查询语言(sql)的转换,其是语义解析领域的一个子任务,本质是将用户的自然语言转化成计算机可以理解并可执行的语义表示,旨在允许用户通过自然语言表达的查询意图来交互地访问和操作存储在关系数据库中的数据。这项技术极大地降低了数据库查询的技术门槛,使得没有sql知识的用户也能够轻松地从数据库中检索信息。

2、nl2sql技术的核心目标是将人类自然语言表达的查询意图准确转换为能够被数据库执行的sql查询语句,涉及理解自然语言中的意图、识别相关的数据实体(如表名、字段名)和条件,以及构建出相应的sql查询结构。nl2sql技术广泛应用于商业智能、在线分析处理(olap)、自动报表生成和虚拟助手等领域,提高了数据驱动决策的效率和准确性,同时让非技术用户也能利用复杂的数据库资源。

3、目前这项任务中存在以下挑战:(1)语言多样性:自然语言表达具有很大的多样性,同一查询意图可本文档来自技高网...

【技术保护点】

1.一种全链路的自然语言转换为结构化查询语言的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤S1中所述的提示工程用于问题提示,问题提示包括生成自然语言问题提示,自然语言问题提示包括数据库表名、字段名及映射和数据字典。

3.根据权利要求2所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤S2具体包括以下步骤;

4.根据权利要求3所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤S24具体包括以下步骤:

5.根据权利要求4所述的全链路的自然语...

【技术特征摘要】

1.一种全链路的自然语言转换为结构化查询语言的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤s1中所述的提示工程用于问题提示,问题提示包括生成自然语言问题提示,自然语言问题提示包括数据库表名、字段名及映射和数据字典。

3.根据权利要求2所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤s2具体包括以下步骤;

4.根据权利要求3所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:步骤s24具体包括以下步骤:

5.根据权利要求4所述的全链路的自然语言转换为结构化查询语言的方法,其特征在于:在步骤s2中,涉及自动化工具和算法来生成初步的语言对,然后通过人...

【专利技术属性】
技术研发人员:胡旭阳李荣华秦宏超王国仁
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1