【技术实现步骤摘要】
经由复述进行结构化查询生成的自然语言
本专利技术一般而言涉及机器翻译成文本。更具体而言,使用基于复述的模型处理结构化查询语言(SQL)查询,该模型测量形成两个语句的话语的序列之间的相似度,以预测输入问题的含义与不同可能的SQL查询的匹配,从而避免在适应新的域时训练新模型的需要。
技术介绍
与数据库的自然语言接口:业务用法(NLIDB)对于机器阅读理解、问题解答等是重要的。NLIDB的实际应用包括DeepQA,该术语由IBM使用,以用于其在深度内容分析、自然语言处理、信息检索、机器学习和人工智能的数十年的经验基础上进行的持续研究。DeepQA应用的最近的示例是电视测验节目“Jeopardy!”中Watson超级计算机的表现。NLIDB的现有方法包括基于规则的方法和更近期的基于序列到序列的方法。基于规则的方法依靠诸如依赖树之类的语法规则来理解问题,并依靠手工制定的规则将依赖模式映射到SQL查询。这些方法对依赖错误非常敏感,但是不要求大量的训练数据。但是,手动创建的规则可能不足以适应以前未提出的问题,因此被认为对于 ...
【技术保护点】
1.一种用于处理输入问题的机器翻译的方法,该方法包括:/n在计算机上的处理器中接收以自然语言呈现的输入问题;/n使用所述处理器对所述输入问题进行预处理,以找出可能的结构化查询语言(SQL)查询的一个或多个条件值;/n基于找出的所述一个或多个条件值枚举一个或多个可能的SQL查询;/n使用复述模型对所枚举的SQL查询进行排名,所述复述模型被预训练以确定两个语句中的话语的序列的比较,第一语句包括所述输入问题,第二语句包括所枚举的SQL查询的SQL查询;/n选择排名最高的SQL查询;以及/n对数据库执行该排名最高的SQL查询,以在所述关系数据库中搜索对所述输入问题的响应。/n
【技术特征摘要】
20190213 US 16/275,3031.一种用于处理输入问题的机器翻译的方法,该方法包括:
在计算机上的处理器中接收以自然语言呈现的输入问题;
使用所述处理器对所述输入问题进行预处理,以找出可能的结构化查询语言(SQL)查询的一个或多个条件值;
基于找出的所述一个或多个条件值枚举一个或多个可能的SQL查询;
使用复述模型对所枚举的SQL查询进行排名,所述复述模型被预训练以确定两个语句中的话语的序列的比较,第一语句包括所述输入问题,第二语句包括所枚举的SQL查询的SQL查询;
选择排名最高的SQL查询;以及
对数据库执行该排名最高的SQL查询,以在所述关系数据库中搜索对所述输入问题的响应。
2.如权利要求1所述的方法,还包括返回执行所述排名最高的SQL查询的一个或多个结果以回答所述输入问题。
3.如权利要求2所述的方法,其中自然语言引擎还被用于向用户提供对所述输入问题的所述回答。
4.如权利要求3所述的方法,其中还使用所述自然语言引擎向所述用户提供所述排名最高的SQL查询的解释,以解释被执行以查询所述数据库的所述排名最高的SQL查询。
5.如权利要求1所述的方法,其中所述复述模型包括基于预训练的长短期记忆(LSTM)的模型,该模型接收话语的序列的两个语句作为输入并确定所述两个语句的相似度。
6.如权利要求5所述的方法,其中所述预训练的复述模型包括长短期记忆递归神经网络(LSTMRNN)。
7.如权利要求5所述的方法,其中以监督方式和弱监督方式之一训练所述预训练的复述模型。
8.如权利要求5所述的方法,其中以监督方式训练所述预训练的复述模型,在该监督方式中手动收集用于训练的语句对。
9.如权利要求5所述的方法,其中以弱监督方式训练所述预训练的复述模型,在该弱监督方式中使用关于同一事件的大量新闻来收集用于训练的语句对。
10.如权利要求1所述的方法,该方法在云服务中实现。
11.如权利要求1所述的方法,该方法在能够访问所述关系数据库的服务器上实现。
12.一种响应输入问题以查询数据库的基于计算机的方法,该方法包括:
使用计算机上的处理器以自然语言接收输入问题;
根据所述输入问题生成话语的序列;
根据所述输入问题的词生成可能的结构化查...
【专利技术属性】
技术研发人员:V·舍伊宁,王治国,吴凌飞,许坤,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。