System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据库语言的生成方法及其模型的训练方法、装置和设备制造方法及图纸_技高网

数据库语言的生成方法及其模型的训练方法、装置和设备制造方法及图纸

技术编号:41269317 阅读:9 留言:0更新日期:2024-05-11 09:24
本申请公开了一种数据库语言的生成的方法及其模型的训练方法、装置和设备,该方法包括:获取指定领域的训练样本,其中,所述训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于所述训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于提取指定领域的语义特征和文本与数据库实体的关联关系特征的预训练模型;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种数据库语言的生成的方法及其模型的训练方法、装置和设备。


技术介绍

1、目前,通过人工撰写以结构化查询语言(structured query language,sql)等结构化语句访问数据是关系型数据库的主要使用方法,但由于其语法特殊,人工撰写特别对于非技术人员而言往往费时费力。针对此,数据库自然语言接口(natural languageinterface to database,nlidb)允许用户通过自然语言与数据库进行交互,降低了数据库使用门槛。其中,文本转sql(text-to-sql)作为nlidb的核心技术,能够将数据库的结构化信息与自然语言形式的用户问题结合,生成可执行的sql查询语句。

2、随着深度学习的发展和大规模标注数据集的出现,采用编码器-解码器(encoder-decoder)架构的深度学习模型是现有的文本转sql的主流方法。该类架构通常通过长短期记忆网络(long short-term memory,lstm)、图神经网络(graph neural network,gnn)等神经网络作为编码器,对问题文本和数据库内容进行编码,再基于sql语法进行解码生成数据库查询语句。

3、在将上述模型直接应用于一些专业领域时,则会由于缺乏对某些专业领域的知识积累,难以基于专业领域的问题文本生成准确的sql查询语句。


技术实现思路

1、本申请的多个方面提供一种数据库语言生成方法及其模型的训练方法、装置和设备,用于解决现有技术中的文本转数据库语言的模型通常缺乏一些专业领域的知识累积,导致将这类模型应用于某些专业领域的问答场景时,难以基于这些专业领域的问题文本生成准确的数据库语言的问题。

2、为解决上述技术问题,本申请实施例是这样实现的:

3、第一方面,提出了一种数据库语言生成模型的训练方法,包括:

4、获取指定领域的训练样本,其中,所述训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于所述训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;

5、基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于提取指定领域的语义特征和所述标注信息特征的预训练模型;

6、基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练;所述数据库语言生成模型,以所述预训练模型作为提取指定领域的语义特征和所述标注信息特征的编码器,以及,以所述语义解析模型作为解析所述预训练模型提取得到的特征的解码器。

7、第二方面,提出了一种数据库语言的生成方法,包括:

8、获取待转换的指定领域的目标查询语句文本;

9、将所述目标查询语句文本输入至如第一方面所述的数据库语言生成模型中,以输出得到所述目标查询语句文本对应的数据库语言。

10、第三方面,提出了一种数据库语言生成模型的训练装置,包括:

11、样本获取模块,用于获取指定领域的训练样本,其中,所述训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于所述训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;

12、第一训练模块,用于基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于提取指定领域的语义特征和所述标注信息特征的预训练模型;

13、第二训练模块,用于基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练;所述数据库语言生成模型,以所述预训练模型作为提取指定领域的语义特征和所述标注信息特征的编码器,以及,以所述语义解析模型作为解析所述预训练模型提取得到的特征的解码器。

14、第四方面,提出了一种数据库语言的生成装置,包括:

15、获取模块,用于获取待转换的指定领域的目标查询语句文本;

16、生成模块,用于将所述目标查询语句文本输入至如第一方面任一所述的数据库语言生成模型中,以输出得到所述目标查询语句文本对应的数据库语言。

17、第五方面,提出了一种电子设备,包括:存储器和处理器;

18、所述存储器,用于存储计算机程序;

19、所述处理器,与所述存储器耦合,用于执行所述计算机程序,以用于:获取指定领域的训练样本,其中,所述训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于所述训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于提取指定领域的语义特征和所述标注信息特征的预训练模型;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练;所述数据库语言生成模型,以所述预训练模型作为提取指定领域的语义特征和所述标注信息特征的编码器,以及,以所述语义解析模型作为解析所述预训练模型提取得到的特征的解码器;或者,

20、获取待转换的指定领域的目标查询语句文本;将所述目标查询语句文本输入至如第一方面所述的数据库语言生成模型中,以输出得到所述目标查询语句文本对应的数据库语言。

21、第六方面,提出了一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现第一方面所述数据库语言生成模型的训练方法或第二方面所述的数据库语言的生成方法的步骤。

22、本申请实施例采用上述技术方案至少可以达到下述技术效果:

23、采用本申请实施例提供的方法,能够获取指定领域的训练样本,该训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;并首先基于多段指定领域的查询语句文本及其对应的数据库语言,以及标注信息,对预训练模型进行训练,以得到能够用于提取指定领域的语义特征和标注信息特征的预训练模型;再基于多段指定领域的查询语句文本及其对应的数据库语言,以及标注信息,对数据库语言生成模型进行训练;该数据库语言生成模型由于能够以预训练模型作为提取指定领域的语义特征和标注信息特征的编码器,以及,以语义解析模型作为解析预训练模型提取得到的特征的解码器,使得最终训练得到的数据库语言生成模型既能提取到指定领域的查询语句文本与对应的数据库语言的关联特征,又能准确识别到指定领域的语言表述特征,从而提升数据库语言生成模型基于指定领域的问题文本生成的数据库语言的准确性。

本文档来自技高网...

【技术保护点】

1.一种数据库语言生成模型的训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述获取指定领域的训练样本,包括:

3.如权利要求2所述的方法,其特征在于,所述基于所述映射关系,构建多个查询语句模板及其对应的数据库语言模板,包括:

4.如权利要求1所述的方法,其特征在于,所述基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于指定领域的语义特征和文本与数据库实体的关联关系特征提取的预训练模型,包括:

5.如权利要求4所述的方法,其特征在于,所述基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练,包括:

6.如权利要求1~5中任一所述的方法,其特征在于,一段所述指定领域的查询语句文本包括多个连续的查询语句文本。

7.一种数据库语言的生成方法,其特征在于,包括:

8.一种数据库语言生成模型的训练装置,其特征在于,包括:

9.一种数据库语言的生成装置,其特征在于,包括:

10.一种电子设备,其特征在于,包括:存储器和处理器;

11.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现权利要求1~6中任一项所述数据库语言生成模型的训练方法或权利要求7所述的数据库语言的生成方法的步骤。

...

【技术特征摘要】

1.一种数据库语言生成模型的训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述获取指定领域的训练样本,包括:

3.如权利要求2所述的方法,其特征在于,所述基于所述映射关系,构建多个查询语句模板及其对应的数据库语言模板,包括:

4.如权利要求1所述的方法,其特征在于,所述基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于指定领域的语义特征和文本与数据库实体的关联关系特征提取的预训练模型,包括:

5.如权利要求4所述的方法,其特征在于,所述基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对...

【专利技术属性】
技术研发人员:戴桢锦刘梅琛李昊
申请(专利权)人:人保信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1