结构化查询语言语句生成方法和系统技术方案

技术编号:33771994 阅读:72 留言:0更新日期:2022-06-12 14:24
本公开提供一种结构化查询语言语句生成方法和系统,所述生成方法包括:将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征;语义编码模型是基于结构化文本及表格样本以及预先确定的生成目标标签进行训练后得到的;基于自然语言文本和查询表格生成候选短句,将自然语言文本和候选短句分别输入匹配模型,输出候选短句中与自然语言文本相匹配的表值;将结构化查询语言子句以及表头的联合表征、表值拼接,生成结构化查询语言语句。本公开保证了模型运行效率,显著提升了匹配的准确性。性。性。

【技术实现步骤摘要】
结构化查询语言语句生成方法和系统


[0001]本公开涉及自然语言处理业务
,尤其涉及一种结构化查询语言语句生成方法和系统、电子设备和存储介质。

技术介绍

[0002]把人类的自然语言转换成成机器能理解的结构化查询语言语句,从数据库查询答案返回,这样可以充当语言

数据库的智能桥梁,让不熟悉数据库的用户只通过自然语言就能够快速地查询到自己想要的数据,该技术在人机交互中有巨大的价值。目前,基于分解任务结构化查询语言生成方式中的表值生成非常复杂,这一部分需要两个子任务协同完成:先通过序列标注从自然语言中选出可能的候选表值,因为可能的表值有多个;再通过匹配将选出的多个表值和对应的条件子句对应上。此外,还需要一个后处理操作。由于标注任务和匹配任务都是相对复杂的操作,这既增加了模型层面的复杂度,同时后处理也非常繁琐,方法不简洁,非常容易出错。

技术实现思路

[0003]本公开提供一种结构化查询语言语句生成方法和系统、电子设备和存储介质,用以解决现有技术中存在的技术缺陷。
[0004]本公开提供一种结构化查询语言语句生成方法,包括:
[0005]将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征;其中,所述语义编码模型是基于结构化文本及表格样本以及预先确定的生成目标标签进行训练后得到的;
[0006]基于所述自然语言文本和所述查询表格生成候选短句;
[0007]将所述自然语言文本和所述候选短句分别输入匹配模型,输出所述候选短句中与所述自然语言文本相匹配的表值;其中,所述匹配模型为基于带标记的文本和结构化查询语言语句样本以及预先确定的表征配对标签进行训练后得到的;
[0008]将所述结构化查询语言子句以及表头的联合表征、所述候选短句中与所述自然语言文本相匹配的表值拼接,生成结构化查询语言语句。
[0009]根据本公开提供的结构化查询语言语句生成方法,其中,所述基于所述自然语言文本和所述查询表格生成候选短句包括:
[0010]基于所述自然语言文本,在查询表格中选中候选单元,选择所述查询表格中与所述候选单元对应的表值;
[0011]依次将候选单元和所述候选短句中与所述自然语言文本相匹配的表值拼接,形成所述候选短句。
[0012]根据本公开提供的结构化查询语言语句生成方法,其中,所述将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征,包括:
[0013]将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出若干个子任务对应的结构化查询语言子句以及表头的联合表征;
[0014]将若干个子任务对应的结构化查询语言子句以及表头的联合表征进行拼接,形成结构化查询语言子句以及表头的联合表征。
[0015]根据本公开提供的结构化查询语言语句生成方法,其中,所述语义编码模型在训练过程中采用的损失函数为:
[0016][0017]其中,表示预先确定的生成目标标签,表示语义编码模型训练时的输出结果,n1表示语义编码模型输出结果的分类数。
[0018]根据本公开提供的结构化查询语言语句生成方法,其中,所述匹配模型在训练过程中采用的损失函数为:
[0019][0020]其中,表示预先确定的表征配对标签,表示匹配模型训练时的输出结果,n2表示匹配模型输出结果的分类数。
[0021]本公开还提供了一种结构化查询语言语句生成系统,包括:
[0022]语义编码模块,用于将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征;其中,所述语义编码模型是基于结构化文本及表格样本以及预先确定的生成目标标签进行训练后得到的;
[0023]候选短句生成模块,用于基于所述自然语言文本和所述查询表格生成候选短句;
[0024]表值匹配模块,用于将所述自然语言文本和所述候选短句分别输入匹配模型,输出所述候选短句中与所述自然语言文本相匹配的表值;其中,所述匹配模型为基于带标记的文本和结构化查询语言语句样本以及预先确定的表征配对标签进行训练后得到的;
[0025]拼接模块,用于将所述结构化查询语言子句以及表头的联合表征、所述候选短句中与所述自然语言文本相匹配的表值拼接,生成结构化查询语言语句。
[0026]根据本公开提供的结构化查询语言语句生成系统,所述候选短句生成模块,具体用于:
[0027]基于所述自然语言文本,在查询表格中选中候选单元,选择所述查询表格中与所述候选单元对应的表值;
[0028]依次将候选单元和所述候选短句中与所述自然语言文本相匹配的表值拼接,生成所述候选短句。
[0029]根据本公开提供的结构化查询语言语句生成系统,其中,所述语义编码模块具体用于:
[0030]将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出若干个子任务对应的结构化查询语言子句以及表头的联合表征;
[0031]将若干个子任务对应的结构化查询语言子句以及表头的联合表征进行拼接,形成
结构化查询语言子句以及表头的联合表征。
[0032]本公开还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述结构化查询语言语句生成方法的步骤。
[0033]本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述结构化查询语言语句生成方法的步骤。
[0034]本公开通过语义编码模型生成结构化查询语言子句以及表头的联合表征,通过匹配模型生成自然语言文本和候选短句相匹配的表值,然后将结构化查询语言子句以及表头的联合表征以及表值相拼接形成结构化查询语言语句,采用了高效的两段式生成方法,减少了子任务数量并且不需要做后处理,简化了结构化查询语言语句生成流程,保证了模型运行效率,经过调优改良后的两段模型显著提升了匹配的准确性。
附图说明
[0035]为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1是本公开实施例提供的结构化查询语言语句生成方法的流程示意图;
[0037]图2是本公开实施例提供的结构化查询语言语句生成方法中的语义编码模型的示意图;
[0038]图3是本公开实施例提供的结构化查询语言语句生成方法中的匹配模型的示意图;
[0039]图4是本公开提供的结构化查询语言语句生成系统的示意图;
[0040]图5是本公开提供的电子设备的结构示意图。
具体实施方式
[0041]为使本公开的目的、技术方案和优点更加清楚,下面将结合本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结构化查询语言语句生成方法,其特征在于,包括:将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征;其中,所述语义编码模型是基于结构化文本及表格样本以及预先确定的生成目标标签进行训练后得到的;基于所述自然语言文本和所述查询表格生成候选短句;将所述自然语言文本和所述候选短句分别输入匹配模型,输出所述候选短句中与所述自然语言文本相匹配的表值;其中,所述匹配模型为基于带标记的文本和结构化查询语言语句样本以及预先确定的表征配对标签进行训练后得到的;将所述结构化查询语言子句以及表头的联合表征、所述候选短句中与所述自然语言文本相匹配的表值拼接,生成结构化查询语言语句。2.根据权利要求1所述的结构化查询语言语句生成方法,其特征在于,所述基于所述自然语言文本和所述查询表格生成候选短句包括:基于所述自然语言文本,在查询表格中选中候选单元,选择所述查询表格中与所述候选单元对应的表值;依次将候选单元和所述候选短句中与所述自然语言文本相匹配的表值拼接,生成所述候选短句。3.根据权利要求1所述的结构化查询语言语句生成方法,其特征在于,所述将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出结构化查询语言子句以及表头的联合表征,包括:将自然语言文本和查询表格中若干个表头输入语义编码模型中,输出若干个子任务对应的结构化查询语言子句以及表头的联合表征;将若干个子任务对应的结构化查询语言子句以及表头的联合表征进行拼接,形成结构化查询语言子句以及表头的联合表征。4.根据权利要求1所述的结构化查询语言语句生成方法,其特征在于,所述语义编码模型在训练过程中采用的损失函数为:其中,表示预先确定的生成目标标签,表示语义编码模型训练时的输出结果,n1表示语义编码模型输出结果的分类数。5.根据权利要求1所述的结构化查询语言语句生成方法,其特征在于,所述匹配模型在训练过程中采用的损失函数为:其中,表示预先确定的表征配对标签,表示匹配模型训练时的输出...

【专利技术属性】
技术研发人员:袁韶祖陈蒙祝天刚
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1