一种将文本转换为SQL语句的方法及设备技术

技术编号:38583974 阅读:10 留言:0更新日期:2023-08-26 23:27
本申请涉及数据处理技术领域,尤其涉及一种将文本转换为SQL语句的方法及设备,在本申请实施例中,城市问答系统使用语言大模型处理输入的问题语句,具体的,该城市问答系统将问题语句填充到schema link模板,再通过语言大模型,得到schema link信息;城市问答系统再将该schema link信息填充到问题难度分类模板,然后通过语言大模型,得到问题难度分类信息;城市问答系统再根据问题难度分类信息,填充SQL语句生成模板,然后通过语言大模型,得到SQL语句。城市问答系统通过语言大模型将问题语句对应的文本转化为SQL语句的过程逐步分解,提高了城市问答系统的可靠性、鲁棒性和可泛化性。泛化性。泛化性。

【技术实现步骤摘要】
一种将文本转换为SQL语句的方法及设备


[0001]本申请涉及数据处理
,尤其涉及一种将文本转换为SQL语句的方法及设备。

技术介绍

[0002]在城市问答系统的应用场景中,用于回答用户提问的答案往往存放在关系型数据库中,城市问答系统在接收到问题语句之后,需要将该问题语句转换为结构化查询语言(Structured Query Language,SQL)语句,并基于该SQL语句在关系型数据库中,查找该SQL语句对应的答案。
[0003]在现有技术中,在将问题语句转换为SQL语句时,往往通过一个语言模型实现,如基于转换器的双向编码器表示(Bidirectional Encoder Representations from Transformer,Bert)模型等。具体包括两种方式:方式一是Bert模型直接生成问题语句对应的SQL语句;方式二是Bert模型对问题语句进行命名实体识别和分类,确定问题语句对应的问题类型、主题及关键字,然后用预先定义好的该问题类型模板拼装成SQL语句。
[0004]但是,方式一中由于Bert模型的性能限制,不能准确理解问题语句中的用户意图,并且直接将问题语句转化成SQL语句,转换跨度太大,将文本转换为SQL语句的转换准确率过低;方式二中由于需要使用模板生成SQL语句,对于每一种问题类型,都需要一个模板相匹配,这就需要构造大量的模板,并且实际使用中往往出现模板不足的情况,导致将文本转换为SQL语句的准确率低。

技术实现思路

[0005]本申请提供了一种将文本转换为SQL语句的方法及设备,用以解决现有技术中将问题语句转换为SQL语句时,转换的准确率低的问题。
[0006]第一方面,本申请实施例提供了一种将文本转换为SQL语句的方法,所述方法包括:将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取所述语言大模型输出的所述问题语句对应的schema link信息;根据所述schema link信息以及所述问题语句,对问题难度分类模板进行填充,并将填充好的问题难度分类模板输入到所述语言大模型中,获取所述语言大模型输出的所述问题语句对应的问题难度分类信息;根据所述问题难度分类信息、所述schema link信息以及所述问题语句,对结构化查询语言SQL语句生成模板进行填充,并将填充好的SQL语句生成模板输入到所述语言大模型中,获取所述语言大模型输出的SQL语句。
[0007]第二方面,本申请实施例还提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述将文本转换为SQL语句的方法的步骤。
[0008]在本申请实施例中,城市问答系统将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取该语言大模型输出的该问题语句对应的schema link信息;根据该schema link信息以及该问题语句,对问题难度分类模板进行填充,并将填充好的问题难度分类模板输入到该语言大模型中,获取该语言大模型输出的该问题语句对应的问题难度分类信息;根据该问题难度分类信息、该schema link信息以及该问题语句,对结构化查询语言SQL语句生成模板进行填充,并将填充好的SQL语句生成模板输入到该语言大模型中,获取该语言大模型输出的SQL语句。在本申请实施例中,城市问答系统使用语言大模型处理输入的问题语句,具体的,该城市问答系统将问题语句填充到schema link模板,再通过语言大模型,得到schema link信息;城市问答系统再将该schema link信息填充到问题难度分类模板,然后通过语言大模型,得到问题难度分类信息;城市问答系统再根据问题难度分类信息,填充SQL语句生成模板,然后通过语言大模型,得到SQL语句。城市问答系统通过语言大模型将问题语句转化为SQL语句的过程逐步分解,提高了城市问答系统的可靠性、鲁棒性和可泛化性。
附图说明
[0009]为了更清楚地说明本申请的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本申请实施例提供的一种将文本转换为SQL语句的过程示意图;图2为现有技术提供的将文本转换为SQL语句的实体图;图3为本申请实施例提供的schema link模板的示意图;图4为本申请实施例提供的问题难度分类模板的示意图;图5为本申请实施例提供的简单问题对应的第一SQL语句生成模板的示意图;图6为本申请实施例提供的简单问题对应的第二SQL语句生成模板的示意图;图7为本申请实施例提供的简单问题对应的第三SQL语句生成模板的示意图;图8为本申请实施例提供的将文本转换为SQL语句的流程示意图;图9为本申请实施例提供的一种将文本转换为SQL语句的装置结构示意图;图10为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
[0011]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0012]为了提高将文本转换为SQL语句的准确率,本申请实施例提供了一种将文本转换为SQL语句的方法及设备。
[0013]在本申请实施例中,城市问答系统将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取该语言大模型输出的该问题语句对应的schema link信息;根据该schema link信息以及该问题语句,对问题难度分类模板进行
填充,并将填充好的问题难度分类模板输入到该语言大模型中,获取该语言大模型输出的该问题语句对应的问题难度分类信息;根据该问题难度分类信息、该schema link信息以及该问题语句,对结构化查询语言SQL语句生成模板进行填充,并将填充好的SQL语句生成模板输入到该语言大模型中,获取该语言大模型输出的SQL语句。
[0014]图1为本申请实施例提供的一种将文本转换为SQL语句的过程示意图,该过程包括:S101:将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取所述语言大模型输出的所述问题语句对应的schema link信息。
[0015]本申请实施例提供的一种将文本转换为SQL语句的方法应用于城市问答系统。
[0016]在城市问答系统的应用场景中,用于回答用户提问的问题语句的答案往往存放在关系型数据库中。城市问答系统在接收到用户输入的问题语句对应语音之后,该城市问答系统将该语音转换为问题语句对应的文本,再将该问题语句对应的文本转换为SQ本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种将文本转换为SQL语句的方法,其特征在于,所述方法包括:将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取所述语言大模型输出的所述问题语句对应的schema link信息;根据所述schema link信息以及所述问题语句,对问题难度分类模板进行填充,并将填充好的问题难度分类模板输入到所述语言大模型中,获取所述语言大模型输出的所述问题语句对应的问题难度分类信息;根据所述问题难度分类信息、所述schema link信息以及所述问题语句,对结构化查询语言SQL语句生成模板进行填充,并将填充好的SQL语句生成模板输入到所述语言大模型中,获取所述语言大模型输出的SQL语句。2.根据权利要求1所述的方法,其特征在于,所述schema link模板包括:用于提示所述语言大模型进行schema link识别的第一提示词、预设的表信息、示例问题语句、示例问题语句对应的示例schema link信息以及待填充问题语句的第一字段。3.根据权利要求2所述的方法,其特征在于,所述将问题语句填充到schema link模板中包括:获取预先保存的所述schema link模板中所述待填充问题语句的第一字段对应的第一位置信息;根据所述第一位置信息,将所述问题语句写入到所述第一字段中。4.根据权利要求1所述的方法,其特征在于,所述问题难度分类模板包括:用于提示所述语言大模型进行问题难度分类的第二提示词、预设的表信息、问题难度分类信息分别对应的示例问题语句和示例schema link信息、待填充问题语句的第二字段以及待填充schema link信息的第三字段。5.根据权利要求4所述的方法,其特征在于,所述根据所述schema link信息以及所述问题语句,对问题难度分类模板进行填充包括:获取预先保存的所述问题难度分类模板中所述待填充问题语句的第二字段对应的第二位置信息,以及所述待填充schema link信息的第三字段对应的第三位置信息;根据所述第二位置信息,将所述问题语句写入到所述第二字段中;根据所述第三位置信息,将所述schema link信息写入到所述第三字段中。6.根据权利要求1所述的方法,其特征在于,所述问题难度分类信息包括:简单问题、非嵌套复杂问题或嵌套复杂问题。7.根据权利要求6所述的方法,其特征在于,所述SQL语句生成模板包括:简单问题对应的第一SQL语句生成模板、非嵌套复杂问题对应的第二SQL语句生成模板以及嵌套复杂问题对应的第三SQL语句生成模板;其中,所述第一SQL语句生成模板包括用于提示所述语言大模型进行SQL语句生成的第三提示词、预设的表信息、难度分类信息为简单问题的第一示例问题语句、所述第一示例问题语句的第一示例schema link信息、所...

【专利技术属性】
技术研发人员:陈帅刘微张建安曲磊
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1