查询语句生成方法、数据查询方法及生成模型训练方法技术

技术编号:38005283 阅读:11 留言:0更新日期:2023-06-30 10:20
本说明书实施例提供查询语句生成方法、数据查询方法及生成模型训练方法,其中所述查询语句生成方法包括:接收查询请求;根据目标数据库标识,确定目标数据库的数据库模式;根据查询信息和数据库模式,构建查询结构关系图;将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型,在生成模型的编码器中对查询信息和查询结构关系图进行融合编码,有效地在编码器中注入结构信息,提高了生成模型的推理能力,准确生成目标查询语句。准确生成目标查询语句。准确生成目标查询语句。

【技术实现步骤摘要】
查询语句生成方法、数据查询方法及生成模型训练方法


[0001]本说明书实施例涉及计算机
,特别涉及一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种生成模型训练方法,一种查询语句生成装置,一种数据查询装置,一种生成模型训练装置,一种数据查询系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序。

技术介绍

[0002]随着计算机技术的发展,越来越多的工作和学习任务可以实现自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术实现数据查询,从而大大节省人力资源。
[0003]目前,自然语言处理(NLP,Natura l Language Process ing)技术的各种任务都可以在预训练模型的加持下得到了显著提升,然而,这种完全基于深度学习模型(transformer)的结构无法有效考虑数据之间的关联关系,导致模型缺少推理能力,无法生成准确的查询语句(SQL,Structured Query Language),因此,亟需一种考虑数据之间的关联关系且准确性高的查询语句生成方案。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种生成模型训练方法,一种查询语句生成装置,一种数据查询装置,一种生成模型训练装置,一种数据查询系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种查询语句生成方法,包括:
[0006]接收查询请求,其中,查询请求包括查询信息和目标数据库标识;
[0007]根据目标数据库标识,确定目标数据库的数据库模式;
[0008]根据查询信息和数据库模式,构建查询结构关系图,其中,查询结构关系图表征查询信息和数据库模式之间的关联关系;
[0009]将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句。
[0010]根据本说明书实施例的第二方面,提供了一种数据查询方法,包括:
[0011]接收用户通过前端输入的查询请求,其中,查询请求包括查询信息和目标数据库标识;
[0012]根据目标数据库标识,确定目标数据库的数据库模式;
[0013]根据查询信息和数据库模式,构建查询结构关系图,其中,查询结构关系图表征查询信息和数据库模式之间的关联关系;
[0014]将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语
句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句;
[0015]利用目标查询语句,在查询数据库中查找获得查询信息对应的查询结果;
[0016]将查询结果发送至前端,以使前端显示查询结果。
[0017]根据本说明书实施例的第三方面,提供了一种生成模型训练方法,应用于云侧设备,包括:
[0018]获取样本集,其中,样本集包括多个样本查询信息,样本查询信息携带查询标签;
[0019]将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型,获得各样本查询信息对应的预测语句,其中,初始生成模型包括编码器和解码器,编码器用于对样本查询信息和样本结构关系图进行融合编码,解码器用于对样本融合特征解码得到预测语句;
[0020]根据预测语句和查询标签,对初始生成模型进行训练,获得训练得到的生成模型的模型参数;
[0021]向端侧设备发送训练得到的生成模型的模型参数。
[0022]根据本说明书实施例的第四方面,提供了一种查询语句生成装置,包括:
[0023]第一接收模块,被配置为接收查询请求,其中,查询请求包括查询信息和目标数据库标识;
[0024]第一确定模块,被配置为根据目标数据库标识,确定目标数据库的数据库模式;
[0025]第一构建模块,被配置为根据查询信息和数据库模式,构建查询结构关系图,其中,查询结构关系图表征查询信息和数据库模式之间的关联关系;
[0026]第一输入模块,被配置为将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句。
[0027]根据本说明书实施例的第五方面,提供了一种数据查询装置,包括:
[0028]第二接收模块,被配置为接收用户通过前端输入的查询请求,其中,查询请求包括查询信息和目标数据库标识;
[0029]第二确定模块,被配置为根据目标数据库标识,确定目标数据库的数据库模式;
[0030]第二构建模块,被配置为根据查询信息和数据库模式,构建查询结构关系图,其中,查询结构关系图表征查询信息和数据库模式之间的关联关系;
[0031]第二输入模块,被配置为将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句;
[0032]查找模块,被配置为利用目标查询语句,在查询数据库中查找获得查询信息对应的查询结果;
[0033]第一发送模块,被配置为将查询结果发送至前端,以使前端显示查询结果。
[0034]根据本说明书实施例的第六方面,提供了一种生成模型训练装置,应用于云侧设备,包括:
[0035]获取模块,被配置为获取样本集,其中,样本集包括多个样本查询信息,样本查询信息携带查询标签;
[0036]第三输入模块,被配置为将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型,获得各样本查询信息对应的预测语句,其中,初始生成模型包括编码器和解码器,编码器用于对样本查询信息和样本结构关系图进行融合编码,解码器用于对样本融合特征解码得到预测语句;
[0037]训练模块,被配置为根据预测语句和查询标签,对初始生成模型进行训练,获得训练得到的生成模型的模型参数;
[0038]第二发送模块,被配置为向端侧设备发送训练得到的生成模型的模型参数。
[0039]根据本说明书实施例的第七方面,提供了一种数据查询系统,该数据查询系统包括客户端和服务端;
[0040]客户端,被配置为向服务端发送查询请求,其中,查询请求包括查询信息和目标数据库标识;
[0041]服务端,被配置为根据目标数据库标识,确定目标数据库的数据库模式;根据查询信息和数据库模式,构建查询结构关系图,其中,查询结构关系图表征查询信息和数据库模式之间的关联关系;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种查询语句生成方法,包括:接收查询请求,其中,所述查询请求包括查询信息和目标数据库标识;根据所述目标数据库标识,确定目标数据库的数据库模式;根据所述查询信息和所述数据库模式,构建查询结构关系图,其中,所述查询结构关系图表征所述查询信息和所述数据库模式之间的关联关系;将所述查询信息和所述查询结构关系图输入生成模型,获得所述查询信息对应的目标查询语句,其中,所述生成模型包括编码器和解码器,所述编码器用于对所述查询信息和所述查询结构关系图进行融合编码,所述解码器用于对融合编码特征解码得到所述目标查询语句。2.根据权利要求1所述的方法,所述根据所述目标数据库标识,确定目标数据库的数据库模式,包括:查找所述目标数据库标识对应的目标数据库;对所述目标数据库的数据库结构进行分析,确定所述目标数据库的数据库模式,其中,所述数据库模式包括数据库对象和所述数据库对象之间的关联关系。3.根据权利要求1所述的方法,所述根据所述查询信息和所述数据库模式,构建查询结构关系图,包括:提取所述查询信息中的至少一个关键词;以所述至少一个关键词和所述数据库模式中的数据库对象为节点,所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边,构建查询结构关系图。4.根据权利要求3所述的方法,所述以所述至少一个关键词和所述数据库模式中的数据库对象为节点,所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边,构建查询结构关系图之后,还包括:在所述查询结构关系图中增加桥接节点;通过所述桥接节点连接所述查询结构关系图中的第一节点和第二节点,获得更新后的查询结构关系图,其中,所述第一节点和第二节点为所述查询结构关系图中不存在边的两个节点。5.根据权利要求1所述的方法,所述编码器包括图处理层和多个编码层;所述将所述查询信息和所述查询结构关系图输入生成模型,获得所述查询信息对应的目标查询语句,包括:将所述查询结构关系图输入所述图处理层,获得所述查询结构关系图对应的结构特征;针对任一编码层,基于所述结构特征和上一编码层输出的查询特征,确定本层的输出,其中,第一层的输入为所述查询信息,最后一层的输出为融合编码特征;将所述融合编码特征输入所述解码器中,获得所述查询信息对应的目标查询语句。6.根据权利要求5所述的方法,所述将所述查询结构关系图输入所述图处理层,获得所述查询结构关系图对应的结构特征,包括:将所述查询结构关系图输入所述图处理层,经所述图处理层的映射处理,获得初始结
构特征、键向量和值向量;根据所述初始结构特征、所述键向量和所述值向量,确定所述查询结构关系图对应的结构特征。7.根据权利要求5所述的方法,所述基于所述结构特征和上一编码层输出的查询特征,确定本层的输出,包括:将所述查询信息输入所述多个编码层中的第一层,获得所述查询信息对应的查询特征;合并所述查询特征和所述结构特征,获得更新后的查询特征,并将所述更新后的查询特征输入下一编码层,获得所述下一编码层的输出的查询特征,返回执行所述合并所述查询特征和所述结构特征,获得更新后的查询特征的步骤,直至最后一个编码层输出融合编码特征。8.根据权利要求1所述的方法,所述生成模型的训练方式,包括:获取样本集,其中,所述样本集包括多个样本查询信息,所述样本查询信息携带查询标签;从所述样本集中提取第一样本查询信息,其中,所述第一样本查询信息为所述样本集中的任一个;将所述第一样本查询信息和所述第一样本查询信息对应的第一样本结构关系图输入初始生成模型,获得所述第一样本查询信息对应的第一预测语句,其中,所述初始生成模型包括编码器和解码器,所述编码器用于对所述第一样本查询信息和所述第一样本结构关系图进行融合编码,所述...

【专利技术属性】
技术研发人员:惠彬原李金阳黄非李永彬
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1