文本转SQL模型的优化方法及系统技术方案

技术编号:29459610 阅读:18 留言:0更新日期:2021-07-27 17:28
本发明专利技术实施例提供一种文本转SQL模型的优化方法。该方法包括:将从文本的异构图以及异构图对应的线图中确定的关系特征输入至隐藏层;在隐藏层中,通过两个关系图注意力网络分别对节点特征和边特征迭代更新,将迭代更新后的节点特征输入至输出层;在输出层中确定对应的SQL。本发明专利技术实施例还提供一种文本转SQL模型的优化系统。本发明专利技术实施例在异构图的编码任务中,通过引入异构图的线图结构,丰富语义特征,对边之间的拓扑结构进行建模,进一步提升对异构图的编码能力,同时对节点和边双向建模,使得在面对复杂的连接情况时提升性能。

【技术实现步骤摘要】
文本转SQL模型的优化方法及系统
本专利技术涉及智能语音领域,尤其涉及一种文本转SQL模型的优化方法及系统。
技术介绍
文本转SQL的任务旨在给定相应的数据库模式的情况下将自然语言问题转换为相应的SQL查询语句。为了实现文本转SQL任务,通常会使用SQLNet,TypeSQL,GNNSQL,EditSQL和RATSQL等文本转SQL的模型。这些模型都旨在将输入的自然语言文本和数据库模式一起进行联合编码,然后通过端到端的方式转化成目标输出SQL程序。数据库模式包括数据库中每一个数据表的名称、表中每一列的名称、数据表的主键的集合和数据表之间的外键连接信息。数据库中的表和列统称为模式条目(schemaitems),它们根据从属关系、主键、外键可以构成数据库的模式图(schemagraph)。根据不同模型的编码方式,可以细分为:(1)SQLNet在联合编码时以问句作为上下文,计算每一个模式条目的上下文向量来加强对数据库模式的编码。(2)TypeSQL进一步地考虑每一个输入单词(包括问句和模式条目)的类型信息,比如整数、浮本文档来自技高网...

【技术保护点】
1.一种文本转SQL模型的优化方法,包括:/n将从文本的异构图以及所述异构图对应的线图中确定的关系特征输入至隐藏层,其中,所述关系特征至少包括:所述异构图确定的节点特征以及所述线图确定的边特征,以提升所述关系特征的语义;/n在所述隐藏层中,通过两个关系图注意力网络分别对所述节点特征和所述边特征迭代更新,将迭代更新后的节点特征输入至输出层;/n在所述输出层中确定对应的SQL。/n

【技术特征摘要】
1.一种文本转SQL模型的优化方法,包括:
将从文本的异构图以及所述异构图对应的线图中确定的关系特征输入至隐藏层,其中,所述关系特征至少包括:所述异构图确定的节点特征以及所述线图确定的边特征,以提升所述关系特征的语义;
在所述隐藏层中,通过两个关系图注意力网络分别对所述节点特征和所述边特征迭代更新,将迭代更新后的节点特征输入至输出层;
在所述输出层中确定对应的SQL。


2.根据权利要求1所述的方法,其中,所述线图由所述异构图确定,包括:
当所述异构图中第一条边的目标节点是第二条边的源节点,且所述第一条边与所述第二条边不构成闭环时,在对应的线图中,将与所述第一条边对应的第一节点向与所述第二条边对应的第二节点有向连接。


3.根据权利要求1所述的方法,其中,所述通过两个关系图注意力网络分别对所述节点特征和所述边特征迭代更新包括:
通过第一关系图注意力网络,利用所述异构图确定的节点特征对所述线图的边特征迭代,确定包括局部和非局部的第一节点特征;
通过第二关系图注意力网络,利用所述线图确定的边特征对所述异构图的节点特征迭代,确定局部节点第二节点特征;
将所述第一节点特征以及所述第二特征进行拼接,作为输出层的输入。


4.根据权利要求1所述的方法,其中,所述输出层包括:文本转SQL解码器以及图修剪模块;
其中,所述图修剪模块用于提高所述文本转SQL解码器的判别能力。


5.根据权利要求1所述的方法,其中,所述关系特征在输入层中确定;
所述输入层包括上下文相关的特征提取器或GloVe词向量,用于确定异构图、线图各节点的关系特征,其中,所述节点包括:问题节点、表节点、列节点。

【专利技术属性】
技术研发人员:俞凯曹瑞升陈露
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1