【技术实现步骤摘要】
查询语句生成方法、数据查询方法及生成模型训练方法
[0001]本说明书实施例涉及计算机
,特别涉及一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种生成模型训练方法,一种查询语句生成装置,一种数据查询装置,一种生成模型训练装置,一种数据查询系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序。
技术介绍
[0002]随着计算机技术的发展,越来越多的工作和学习任务可以实现自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术实现数据查询,从而大大节省人力资源。
[0003]目前,自然语言处理(NLP,Natura l Language Process ing)技术的各种任务都可以在预训练模型的加持下得到了显著提升,然而,这种完全基于深度学习模型(transformer)的结构无法有效考虑数据之间的关联关系,导致模型缺少推理能力,无法生成准确的查询语句(SQL,Structured Query Language),因此,亟需一种考虑数据之间的关联关系且准确性高的查询语句生成方案。
技术实现思路
[0004]有鉴于此,本说明书实施例提供了一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种生成模型训练方法,一种查询语句生成装置,一种数据查询装置,一种生成模型训练装置,一种数据查询系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书 ...
【技术保护点】
【技术特征摘要】
1.一种查询语句生成方法,包括:接收查询请求,其中,所述查询请求包括查询信息和目标数据库标识;根据所述目标数据库标识,确定目标数据库的数据库模式;根据所述查询信息和所述数据库模式,构建查询结构关系图,其中,所述查询结构关系图表征所述查询信息和所述数据库模式之间的关联关系;将所述查询信息和所述查询结构关系图输入生成模型,获得所述查询信息对应的目标查询语句,其中,所述生成模型包括编码器和解码器,所述编码器用于对所述查询信息和所述查询结构关系图进行融合编码,所述解码器用于对融合编码特征解码得到所述目标查询语句。2.根据权利要求1所述的方法,所述根据所述目标数据库标识,确定目标数据库的数据库模式,包括:查找所述目标数据库标识对应的目标数据库;对所述目标数据库的数据库结构进行分析,确定所述目标数据库的数据库模式,其中,所述数据库模式包括数据库对象和所述数据库对象之间的关联关系。3.根据权利要求1所述的方法,所述根据所述查询信息和所述数据库模式,构建查询结构关系图,包括:提取所述查询信息中的至少一个关键词;以所述至少一个关键词和所述数据库模式中的数据库对象为节点,所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边,构建查询结构关系图。4.根据权利要求3所述的方法,所述以所述至少一个关键词和所述数据库模式中的数据库对象为节点,所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边,构建查询结构关系图之后,还包括:在所述查询结构关系图中增加桥接节点;通过所述桥接节点连接所述查询结构关系图中的第一节点和第二节点,获得更新后的查询结构关系图,其中,所述第一节点和第二节点为所述查询结构关系图中不存在边的两个节点。5.根据权利要求1所述的方法,所述编码器包括图处理层和多个编码层;所述将所述查询信息和所述查询结构关系图输入生成模型,获得所述查询信息对应的目标查询语句,包括:将所述查询结构关系图输入所述图处理层,获得所述查询结构关系图对应的结构特征;针对任一编码层,基于所述结构特征和上一编码层输出的查询特征,确定本层的输出,其中,第一层的输入为所述查询信息,最后一层的输出为融合编码特征;将所述融合编码特征输入所述解码器中,获得所述查询信息对应的目标查询语句。6.根据权利要求5所述的方法,所述将所述查询结构关系图输入所述图处理层,获得所述查询结构关系图对应的结构特征,包括:将所述查询结构关系图输入所述图处理层,经所述图处理层的映射处理,获得初始结
构特征、键向量和值向量;根据所述初始结构特征、所述键向量和所述值向量,确定所述查询结构关系图对应的结构特征。7.根据权利要求5所述的方法,所述基于所述结构特征和上一编码层输出的查询特征,确定本层的输出,包括:将所述查询信息输入所述多个编码层中的第一层,获得所述查询信息对应的查询特征;合并所述查询特征和所述结构特征,获得更新后的查询特征,并将所述更新后的查询特征输入下一编码层,获得所述下一编码层的输出的查询特征,返回执行所述合并所述查询特征和所述结构特征,获得更新后的查询特征的步骤,直至最后一个编码层输出融合编码特征。8.根据权利要求1所述的方法,所述生成模型的训练方式,包括:获取样本集,其中,所述样本集包括多个样本查询信息,所述样本查询信息携带查询标签;从所述样本集中提取第一样本查询信息,其中,所述第一样本查询信息为所述样本集中的任一个;将所述第一样本查询信息和所述第一样本查询信息对应的第一样本结构关系图输入初始生成模型,获得所述第一样本查询信息对应的第一预测语句,其中,所述初始生成模型包括编码器和解码器,所述编码器用于对所述第一样本查询信息和所述第一样本结构关系图进行融合编码,所述...
【专利技术属性】
技术研发人员:惠彬原,李金阳,黄非,李永彬,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。