用于具有表示混合的跨语言的文本到SQL语义解析的系统、方法和计算机程序技术方案

技术编号:42370701 阅读:31 留言:0更新日期:2024-08-16 14:53
提供了一种由至少一个处理器执行的用于跨语言的文本到SQL语义解析的方法和装置。由所述至少一个处理器执行的方法和计算机程序代码包括:生成源语言话语、目标语言话语和数据库模式的上下文表示;基于源语言话语、目标语言话语和数据库模式的上下文表示,生成目标语言话语和数据库模式的混合表示;拼接目标语言话语和所述数据库模式的混合表示;基于k‑层变换器,对所拼接的目标语言话语和数据库模式的混合表示进行编码;以及基于所编码的所拼接的目标语言话语和数据库模式的混合表示,逐个令牌地生成SQL查询。

【技术实现步骤摘要】
【国外来华专利技术】

与本公开的示例实施例一致的装置和方法通常涉及语义解析领域。更具体地,本公开涉及基于英语数据库模式(schemas)的跨语言的文本到结构化查询语言(structuredquery language,sql)语义解析和生成用于非英语话语的sql查询。


技术介绍

1、语义解析包括将自然语言话语翻译成含义表示(例如,lambda演算和编程语言)。使用sql查询作为含义表示的文本到sql语义解析越来越多地用于学术界和其他行业。文本到sql的语义解析受益于最近有注释的大规模数据集。在相关技术中,已经开发了使用上下文表示的编码器-解码器预训练模型来改进语义解析器。然而,传统的语义解析器主要关注英语话语。传统的跨语言的文本到sql语义解析器的性能不是最佳的。基于机器翻译的语义解析可能是解决传统的跨语言的文本到sql语义解析(例如,将非英语话语翻译成英语,并使用英语解析器生成sql查询)中的问题的有效方法。然而,翻译系统引入了噪声,噪声导致英语解析器做出意想不到的预测。因此,需要能够熟练地处理作为输入的非英语话语的系统,以增强非英语发言者的用户体验并减轻由自动翻译引入的噪声本文档来自技高网...

【技术保护点】

1.一种用于跨语言的文本到结构化查询语言SQL语义解析的方法,由至少一个处理器执行,所述方法包括:

2.根据权利要求1所述的方法,其中,生成上下文表示包括:

3.根据权利要求1所述的方法,其中,生成上下文表示包括:

4.根据权利要求1所述的方法,还包括:对所生成的SQL应用约束解码。

5.根据权利要求1所述的方法,其中,生成所述目标语言话语和所述数据库模式的混合表示包括:在由单层变换器所参数化的混合层中融合所述源语言话语、所述目标语言话语和所述数据库模式的上下文表示。

6.根据权利要求1所述的方法,其中,生成所述目标语言话语和所...

【技术特征摘要】
【国外来华专利技术】

1.一种用于跨语言的文本到结构化查询语言sql语义解析的方法,由至少一个处理器执行,所述方法包括:

2.根据权利要求1所述的方法,其中,生成上下文表示包括:

3.根据权利要求1所述的方法,其中,生成上下文表示包括:

4.根据权利要求1所述的方法,还包括:对所生成的sql应用约束解码。

5.根据权利要求1所述的方法,其中,生成所述目标语言话语和所述数据库模式的混合表示包括:在由单层变换器所参数化的混合层中融合所述源语言话语、所述目标语言话语和所述数据库模式的上下文表示。

6.根据权利要求1所述的方法,其中,生成所述目标语言话语和所述数据库模式的混合表示包括:

7.根据权利要求1所述的方法,其中,生成所述目标语言话语和所述数据库模式的混合表示包括:

8.一种用于跨语言的文本到结构化查询语言sql语义解析的装置,所述装置包括:

9.根据权利要求8所述的装置,所述计算机程序代码还包括:

10.根据权利要求8所述的装置,所述计算机程序代码还包括:

11.根据权利要求8所述的装置,所述计算机程序代码还包括:解码代码,被配置为使得所述至少一个处理器对所生成的sql应用约束解码。

12.根据权利要求8所述的装置,所述...

【专利技术属性】
技术研发人员:宋林峰
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1