System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种大语言模型Text2SQL图表生成方法及装置制造方法及图纸_技高网

一种大语言模型Text2SQL图表生成方法及装置制造方法及图纸

技术编号:40937706 阅读:2 留言:0更新日期:2024-04-18 14:56
本发明专利技术涉及数据处理技术领域,具体提供了一种大语言模型Text2SQL图表生成方法及装置,首先,选用Text2SQL大模型架构,使用基于LORA的方法对模型进行了微调,掌握文本理解和转化为SQL语言的能力;然后,在第一阶段Text2SQL提示词工程架构中,使用LangChain的开发架构进行设计,最后,选择图表生成任务本理解提示词架构,自动捕获并解析新的需求问题。与现有技术相比,本发明专利技术能够在允许用户通过自然语言进行数据查询和生成,极大地简化了数据库操作过程,提高了工作效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体提供一种大语言模型text2sql图表生成方法及装置。


技术介绍

1、目前针对行业数字治理应用领域的数据查询与处理问题,主要存在两种解决方案,但它们各自存在一定的问题和挑战。第一种解决方案是传统sql查询,这是一种在行业数字治理应用领域长期被采用的数据查询和处理方法。这种方法的核心是依赖于关系数据库结构,通过编写结构化的sql查询语句来检索和操作数据。为了确保查询的准确性和有效性,运维人员和行业人员需要具备一定的sql语言学习基础。例如,运维人员需要深入了解数据库表结构,包括各个表之间的关联关系、字段的数据类型及含义等。同时,他们还需要掌握sql查询语句的编写方法,包括基本的增删改查操作,以及更高级的聚合、连接和子查询等操作。这对于非技术人员来说是一项艰巨的任务,因为sql语言本身具有一定的复杂性和专业性。此外,传统sql查询方法还存在一定的可扩展性问题。随着行业数字治理应用的不断发展,数据量不断增加,数据结构也可能发生变化。在这种情况下,原有的sql查询语句可能需要进行大量的修改和优化才能适应新的需求。这无疑增加了运维的难度和成本,也限制了行业数字治理应用的发展速度。

2、第二种解决方案是基于自然语言处理(nlp)技术和bert语言模型架构来尝试解决数据查询与处理问题。这种方法的核心思想是通过训练一个大型的语言模型,使其能够理解并解析用户的自然语言查询,然后将其转化为对应的sql查询语句。然而,尽管这种方法在理论上看起来很有吸引力,但在实际应用中却面临着诸多挑战。首先,自然语言与sql之间存在天然的语义鸿沟。尽管bert等先进的语言模型在自然语言理解方面取得了显著的进展,但它们仍然难以完全理解并准确转化复杂的查询意图。例如,对于涉及多个表格联合查询、嵌套查询或聚合操作的复杂查询需求,基于nlp的方法往往无法生成正确的sql语句。其次,基于nlp的方法在泛化能力方面也存在明显不足。由于训练数据的限制和模型本身的局限性,这些方法往往难以适应新的数据库结构或查询需求。当面对与训练数据分布不同的新场景时,模型的性能可能会大幅下降,甚至无法生成有效的sql语句。

3、在传统数据治理中,运维人员必须掌握sql等技术语言才能进行数据库查询,这对不熟悉计算机技术的行业人员是一个挑战。


技术实现思路

1、本专利技术是针对上述现有技术的不足,提供一种实用性强的大语言模型text2sql图表生成方法。

2、本专利技术进一步的技术任务是提供一种设计合理,安全适用的大语言模型text2sql图表生成装置。

3、本专利技术解决其技术问题所采用的技术方案是:

4、一种大语言模型text2sql图表生成方法,首先,选用text2sql大模型架构,使用基于lora的方法对模型进行了微调,掌握文本理解和转化为sql语言的能力;

5、然后,在第一阶段text2sql提示词工程架构中,使用langchain的开发架构进行设计,最后,选择图表生成任务本理解提示词架构,自动捕获并解析新的需求问题。

6、进一步的,在选用text2sql大模型架构中,具体的设计体系架构为:

7、a1、自然语言编码器的设计;

8、a2、结构化编码器的设计;

9、a3、text2sql架构解码器的设计;

10、a4、模型的微调;

11、a5、训练评估。

12、进一步的,在步骤a1中,首先encoder接受输入整个文本序列,并编码成一个隐层状态序列;

13、文本序列产生于预处理阶段的非结构化文本,并以不重叠文本对的方式产生,转换成为的格式,之后,每个中的单词先转为词向量, 每个也会转为一one-hot向量;

14、one-hot 向量为一种向量表示方法,其中,向量中的一个元素为 1,其余元素均为0,通常用于表示分类变量的唯一性;

15、最后,将每个全部取均值取出作为嵌入向量,最后nl encoder将所有span的嵌入向量输入到一个双向长短记忆网络bi-lstm中, bi-lstm中正向和反向的输出隐层状态都要和拼接起来;

16、bi-lstm为一种深度学习模型,它通过将数据向前和向后传递给两个独立的长短记忆网络,并将这两个方向的信息合并,同时捕捉时序数据中的前向和后向依赖关系。

17、进一步的,在步骤a2中, schema编码器首先将单词转成词向量,将类别向量转成嵌入向量,之后schema编码器将词向量的均值作为字段的初始表示,同时在嵌入向量上执行一个注意力机制, 从而获得一个上下文向量;

18、最后,schema编码器将初始嵌入,类别嵌入和上下文向量三者之和作为字段表示为。

19、进一步的,在步骤a3中,进行合成结构化查询语言模型semql的查询,当需要选择一个字段时,首先决定所述字段是从内部内存中选择,还是直接从数据库结构中提取,一旦特定字段被选定,会从数据库的结构schema中被移除,并被记录在内存中。

20、进一步的,在步骤a4中,选择int4量化版的基础大模型,使用基于lora的微调架构对int4量化版基础大模型在wikisql数据集上进行了微调,微调架构为一种用于高效微调大型模型的技术;

21、在每个transformer模型层中注入可训练的低秩分解矩阵,新矩阵训练以适应新数据,同时保持整体变化数量较低,最终,原始权重和调整后的权重被组合以产生最终结果。

22、进一步的,在步骤a5中,采用以下2个指标对经过text2sql微调的基础大型模型全面的评估;

23、首先,指标一为执行准确率,反映模型生成的sql查询在数据集中正确执行的比例;

24、其次,指标二逻辑形式准确率,衡量模型生成的sql查询与标准sql之间的匹配程度。

25、进一步的,在第一阶段text2sql提示词工程架构中,具体的操作步骤如下:

26、b1、问题理解:

27、首先,对输入的查询问题进行深度解析,通过微调过的大语言模型识别并提取问题中涉及数据库的关键信息元素,根据提取的关键信息,确定所查询的目标数据库类型;

28、b2、根据预设的提示模板格式,将问题文本与数据库模式schema信息进行拼接处理,形成具有完整语义和明确指示作用的提示信息;

29、b3、预期模型将基于所接收的问题及数据库模式schema进行深度推理;

30、所述预期模型输出将包含针对问题的查询sql语句,sql语句为从模型的推理结果中精确提取得出;

31、b4、sql执行与结果反馈;

32、本阶段将对目标数据库执行上一阶段生成的sql查询语句,并将查询结果返回给大型模型进行第二阶段的深度推理,第一阶段架构被设计为自动查询行业数据治理数据库,并将sql查询结果返回给大型模型。

33、进一步的,在图表生成任务本理解提示词本文档来自技高网...

【技术保护点】

1.一种大语言模型Text2SQL图表生成方法,其特征在于,首先,选用Text2SQL大模型架构,使用基于LORA的方法对模型进行了微调,掌握文本理解和转化为SQL语言的能力;

2.根据权利要求1所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在选用Text2SQL大模型架构中,具体的设计体系架构为:

3.根据权利要求2所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在步骤A1中,首先Encoder接受输入整个文本序列,并编码成一个隐层状态序列;

4.根据权利要求3所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在步骤A2中, Schema编码器首先将单词转成词向量,将类别向量转成嵌入向量,之后Schema编码器将词向量的均值作为字段的初始表示,同时在嵌入向量上执行一个注意力机制, 从而获得一个上下文向量;

5.根据权利要求4所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在步骤A3中,进行合成结构化查询语言模型SemQL的查询,当需要选择一个字段时,首先决定所述字段是从内部内存中选择,还是直接从数据库结构中提取,一旦特定字段被选定,会从数据库的结构schema中被移除,并被记录在内存中。

6.根据权利要求5所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在步骤A4中,选择INT4量化版的基础大模型,使用基于LORA的微调架构对INT4量化版基础大模型在WikiSQL数据集上进行了微调,微调架构为一种用于高效微调大型模型的技术;

7.根据权利要求6所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在步骤A5中,采用以下2个指标对经过Text2SQL微调的基础大型模型全面的评估;

8.根据权利要求7所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在第一阶段Text2SQL提示词工程架构中,具体的操作步骤如下:

9.根据权利要求8所述的一种大语言模型Text2SQL图表生成方法,其特征在于,在图表生成任务本理解提示词架构中,具体的步骤包括:

10.一种大语言模型Text2SQL图表生成装置,其特征在于,包括:至少一个存储器和至少一个处理器;

...

【技术特征摘要】

1.一种大语言模型text2sql图表生成方法,其特征在于,首先,选用text2sql大模型架构,使用基于lora的方法对模型进行了微调,掌握文本理解和转化为sql语言的能力;

2.根据权利要求1所述的一种大语言模型text2sql图表生成方法,其特征在于,在选用text2sql大模型架构中,具体的设计体系架构为:

3.根据权利要求2所述的一种大语言模型text2sql图表生成方法,其特征在于,在步骤a1中,首先encoder接受输入整个文本序列,并编码成一个隐层状态序列;

4.根据权利要求3所述的一种大语言模型text2sql图表生成方法,其特征在于,在步骤a2中, schema编码器首先将单词转成词向量,将类别向量转成嵌入向量,之后schema编码器将词向量的均值作为字段的初始表示,同时在嵌入向量上执行一个注意力机制, 从而获得一个上下文向量;

5.根据权利要求4所述的一种大语言模型text2sql图表生成方法,其特征在于,在步骤a3中,进行合成结构化查询语言模型semql的查询,当需要选择一个字段时,首先决定所述字段是...

【专利技术属性】
技术研发人员:王宾李照川张峰张尧臣张悦李捷明王飞林浩
申请(专利权)人:浪潮软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1