结构化查询语言的翻译方法、装置、计算设备及可读存储介质制造方法及图纸

技术编号:30424081 阅读:17 留言:0更新日期:2021-10-24 16:53
本发明专利技术公开了一种结构化查询语言的翻译方法,包括:为结构化查询语言的查询语句构建结构图,结构图包括多个节点和连接节点的边;生成结构图的特征矩阵,特征矩阵包括各节点的节点特征;将结构图的特征矩阵和多个不同阶数的邻接矩阵输入图编码器,以便图编码器输出得到结构图的融合特征矩阵;以及将融合特征矩阵输入解码器,以便解码器输出得到查询语句到自然语言的翻译。本发明专利技术还公开了对应的翻译装置、图卷积网络、计算设备和可读存储介质。计算设备和可读存储介质。计算设备和可读存储介质。

【技术实现步骤摘要】
结构化查询语言的翻译方法、装置、计算设备及可读存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及结构化查询语言的翻译方法、装置、计算设备及可读存储介质。

技术介绍

[0002]随着互联网技术的发展和普及,越来越多的数据都是以电子化的形式在网络中存储和使用。结构化查询语言SQL是一种对于关系数据库的标准查询语言,在数据搜索方面具有强大功能。然而结构化查询语言本身十分复杂,缺乏描述能力,因此对于非技术人员来说难以理解。
[0003]为了方便团队的沟通与协作,有必要对结构化查询语言的查询语句进行自然语言的翻译,从而方便非技术人员的理解。并且,结构化查询语言的查询语句及其自然语言的翻译还可以作为训练数据来辅助基于自然语言生成结构化查询语言的查询语句的任务,一定程度上克服标注数据不足的问题。
[0004]然而,传统的端到端模型在进行SQL语言的查询语句翻译时,往往需要先将查询语句序列化,这种序列化的后果就是忽视了查询语句本身的结构化信息,不够准确。
[0005]因此,需要一种更先进的结构化查询语言的翻译方案以及翻译模型组件。

技术实现思路

[0006]为此,本专利技术实施例提供一种结构化查询语言的翻译方法、装置、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
[0007]根据本专利技术实施例的一个方面,提供了一种结构化查询语言的翻译方法,包括:为结构化查询语言的查询语句构建结构图,结构图包括多个节点和连接节点的边;生成结构图的特征矩阵,特征矩阵包括各节点的节点特征;将结构图的特征矩阵和多个不同阶数的邻接矩阵输入图编码器,以便图编码器输出得到结构图的融合特征矩阵;以及将融合特征矩阵输入解码器,以便解码器输出得到查询语句到自然语言的翻译。
[0008]可选地,在根据本专利技术实施例的方法中,图编码器包括多个图卷积层,图卷积层适于接收多个不同阶数的邻接矩阵;接收特征矩阵或者上一个图卷积层输出的融合特征矩阵;输出当前图卷积层的融合特征矩阵。
[0009]可选地,在根据本专利技术实施例的方法中,图卷积层包括对应于各个不同阶数的邻接矩阵的多个图卷积模块,图卷积模块适于接收与图卷积模块对应的邻接矩阵;接收特征矩阵或者上一个图卷积层的输出。
[0010]可选地,在根据本专利技术实施例的方法中,多个图卷积模块具有相同的权重参数。
[0011]可选地,在根据本专利技术实施例的方法中,图卷积层包括融合模块,融合模块适于将多个图卷积模块的输出进行融合,得到当前图卷积层的融合特征矩阵。
[0012]可选地,在根据本专利技术实施例的方法中,图卷积层表达为以下公式:
[0013][0014]其中,H
l+1
为图卷积层的输出,H
l
为图卷积层的输入,为图卷积层上k阶邻接矩阵的门控矩阵,*表示元素相乘,φ表示Relu函数,σ表示sigmoid函数,λ为标量,K为邻接矩阵的最高阶数,W
l
为图卷积层的权重参数,b
l
为图卷积层的偏置参数。
[0015]可选地,在根据本专利技术实施例的方法中,翻译包括多个自然语言的词,解码器基于图编码器输出的融合特征矩阵和解码器之前输出的词来生成当前输出的词。
[0016]可选地,在根据本专利技术实施例的方法中,解码器包括Transformer模型或者具有注意力机制的长短时记忆模型。
[0017]可选地,在根据本专利技术实施例的方法中,生成结构图的特征矩阵的步骤包括:基于图嵌入算法生成节点的节点特征,以得到特征矩阵。
[0018]可选地,在根据本专利技术实施例的方法中,生成结构图的特征矩阵的步骤包括:基于节点的独热编码、或者概率分布、或者文本属性生成节点的节点特征,以得到特征矩阵。
[0019]可选地,在根据本专利技术实施例的方法中,查询语句用于执行预定操作,为结构化查询语言的查询语句构建结构图的步骤包括:为预定操作创建节点;为预定操作针对的操作对象创建节点,操作对象对应的节点连接至预定操作对应的节点。
[0020]可选地,在根据本专利技术实施例的方法中,查询语句包括功能函数,为结构化查询语言的查询语句构建结构图的步骤包括:为功能函数创建节点,功能函数对应的节点连接至功能函数针对的操作对象对应的节点。
[0021]可选地,在根据本专利技术实施例的方法中,查询语句包括一个或者多个条件,条件包括条件对象和条件约束,为结构化查询语言的查询语句构建结构图的步骤包括:为条件对象和条件约束分别创建节点,条件对象对应的节点连接至条件约束对应的节点;合并条件约束相同的节点。
[0022]可选地,在根据本专利技术实施例的方法中,查询语句包括多个条件之间的逻辑运算符,为结构化查询语言的查询语句构建结构图的步骤包括:为逻辑运算符创建节点,逻辑运算符对应的节点分别连接至与逻辑运算符相关联的条件对象对应的节点以及预定操作对应的节点。
[0023]根据本专利技术实施例的另一个方面,提供了一种结构图的翻译方法,结构图包括多个节点和连接节点的边,方法包括:生成结构图的特征矩阵,特征矩阵包括各节点的节点特征;将结构图的特征矩阵和多个不同阶数的邻接矩阵输入图编码器,以便图编码器输出得到结构图的融合特征矩阵;以及将融合特征矩阵输入解码器,以便解码器输出得到结构图到自然语言的翻译。
[0024]根据本专利技术实施例的另一个方面,提供了一种结构化查询语言的翻译装置,包括:图构建单元,适于为结构化查询语言的查询语句构建结构图,结构图包括多个节点和连接节点的边;矩阵生成单元,适于生成结构图的特征矩阵,特征矩阵包括各节点的节点特征;
以及包括图编码器和解码器的翻译模型组件,其中,图编码器适于接收结构图的特征矩阵和多个不同阶数的邻接矩阵,输出得到结构图的融合特征矩阵,解码器适于接收图编码器输出的融合特征矩阵,输出得到查询语句到自然语言的翻译。
[0025]可选地,在根据本专利技术实施例的装置中,图编码器包括多个图卷积层,图卷积层适于接收多个不同阶数的邻接矩阵;接收特征矩阵或者上一个图卷积层输出的融合特征矩阵;输出当前图卷积层的融合特征矩阵。
[0026]可选地,在根据本专利技术实施例的装置中,图卷积层包括对应于各个不同阶数的邻接矩阵的多个图卷积模块,图卷积模块适于接收与图卷积模块对应的邻接矩阵;接收特征矩阵或者上一个图卷积层的输出。
[0027]可选地,在根据本专利技术实施例的装置中,多个图卷积模块具有相同的权重参数。
[0028]可选地,在根据本专利技术实施例的装置中,图卷积层包括融合模块,融合模块适于将多个图卷积模块的输出进行融合,得到当前图卷积层的融合特征矩阵。
[0029]可选地,在根据本专利技术实施例的装置中,图卷积层表达为以下公式:
[0030][0031]其中,H
l+1
为图卷积层的输出,H
l
为图卷积层的输入,为图卷积层上k阶邻接矩阵的门控矩阵,*表示元素相乘,φ表示Relu函数,σ表示sigmoid函数,λ为标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结构化查询语言的翻译方法,包括:为结构化查询语言的查询语句构建结构图,所述结构图包括多个节点和连接节点的边;生成所述结构图的特征矩阵,所述特征矩阵包括各节点的节点特征;将所述结构图的特征矩阵和多个不同阶数的邻接矩阵输入图编码器,以便所述图编码器输出得到所述结构图的融合特征矩阵;以及将所述融合特征矩阵输入解码器,以便所述解码器输出得到所述查询语句到自然语言的翻译。2.如权利要求1所述的方法,其中,所述图编码器包括多个图卷积层,所述图卷积层适于接收多个不同阶数的邻接矩阵;接收所述特征矩阵或者上一个图卷积层输出的融合特征矩阵;输出当前图卷积层的融合特征矩阵。3.如权利要求2所述的方法,其中,所述图卷积层包括对应于各个不同阶数的邻接矩阵的多个图卷积模块,所述图卷积模块适于接收与所述图卷积模块对应的邻接矩阵;接收所述特征矩阵或者上一个图卷积层的输出。4.如权利要求3所述的方法,其中,所述多个图卷积模块具有相同的权重参数。5.如权利要求3所述的方法,其中,所述图卷积层包括融合模块,所述融合模块适于将所述多个图卷积模块的输出进行融合,得到当前图卷积层的融合特征矩阵。6.如权利要求5所述的方法,其中,所述图卷积层表达为以下公式:6.如权利要求5所述的方法,其中,所述图卷积层表达为以下公式:其中,H
l+1
为所述图卷积层的输出,H
l
为所述图卷积层的输入,为所述图卷积层上k阶邻接矩阵的门控矩阵,*表示元素相乘,φ表示Relu函数,σ表示sigmoid函数,λ为标量,K为邻接矩阵的最高阶数,W
l
为所述图卷积层的权重参数,b
l
为所述图卷积层的偏置参数。7.如权利要求1所述的方法,其中,所述翻译包括多个自然语言的词,所述解码器基于所述图编码器输出的融合特征矩阵和所述解码器之前输出的词来生成当前输出的词。8.如权利要求1所述的方法,其中,所述解码器包括Transformer模型或者具有注意力机制的长短时记忆模型。9.如权利要求1所述的方法,其中,生成所述结构图的特征矩阵的步骤包括:基于图嵌入算法生成所述节点的节点特征,以得到所述特征矩阵。10.如权利要求1所述的方法,其中,生成所述结构图的特征矩阵的步骤包括:基于节点的独热编码、或者概率分布、或者文本属性生成所述节点的节点特征,以得到所述特征矩阵。
11.如权利要求1所述的方法,其中,所述查询语句用于执行预定操作,为结构化查询语言的查询语句构建结构图的步骤包括:为所述预定操作创建节点;为所述预定操作针对的操作对象创建节点,所述操作对象对应的节点连接至所述预定操作对应的节点。12.如权利要求11所述的方法,其中,所述查询语句包括功能函数,为结构化查询语言的查询语句构建结构图的步骤包括:为所述功能函数创建节点,所述功能函数对应的节点连接至所述功能函数针对的操作对象对应的节点。13.如权利要求11所述的方法,其中,所述查询语句包括一个或者多个条件,所述条件包括条件对象和条件约束,为结构化查询语言的查询语句构建结构图的步骤包括:为所述条件对象和所述条件约束分别创建节点,所述条件对象对应的节点连接至所述条件约束对应的节点;合并条件约束相同的节点。14.如权利要求11所述的方法,其中,所述查询语句包括所述多个条件之间的逻辑运算符,为结构化查询语言的查询语句构建结构图的步骤包括:为所述逻辑运算符创建节点,所述逻辑运算符对应的节点分别连接至与所述逻辑运算符相关联的条件对象对应的节点以及所述预定操作对应的节点。15.一种结构图的翻译方法,所述结构图包括多个节点和连接节点的边,所述方法包括:生成所述结构图的特征矩阵,所述特征矩阵包括各节点的节点特征;将...

【专利技术属性】
技术研发人员:张琰邴立东
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1