一种支持自然语言的数据查询方法和系统技术方案

技术编号：21140928 阅读：22 留言：0更新日期：2019-05-18 05:07

本发明专利技术公开了一种支持自然语言的数据查询方法，包括：接收用户自然语言查询语句；基于翻译模型建立自然语言查询语句翻译转换为目标标准SQL语句；判断能否获得目标标准SQL语句；若能，则基于目标标准SQL语句输出数据查询结果；若不能，则提示用户重新输入其它的自然语言查询语句，并且对翻译模型进行模型训练优化。本发明专利技术首先将自然语言查询语句解码翻译成SQL语句，将翻译模型无法翻译预测或者翻译错误的自然查询语句进行正确的标记，扩增模型训练样本集，持续训练以优化现有机器翻译模型，供自然语言查询系统调用。另一方面，还提供了一种支持自然语言的数据查询系统。

A Data Query Method and System Supporting Natural Language

全部详细技术资料下载

【技术实现步骤摘要】
一种支持自然语言的数据查询方法和系统
本专利技术涉及数据查询
，具体来说，涉及一种支持自然语言的数据查询方法和系统。
技术介绍
随着数据库应用及信息检索系统的广泛发展和普及，各种智能便携式信息终端的大量涌现和使用，越来越多的非专业用户需要一种易于掌握的人机接口去访问所需的信息。目前常见的形式大多是以窗口、菜单为主的数据报表，用户只需用鼠标点击以及少量的键盘操作就能从数据库中获取所需的信息。但这种方式不够灵活和全面，很多问题是无法或难以用这种方式表达的。另一种常见方式是通过标准的SQL语言进行数据库查询，尽管SQL语言具有简洁、明快和高效的特点，但它的语言形式有很高的格式要求，其形式也和中文表达方式相差甚远，一般只有数据库专业开发人员才能掌握，普通用户很难掌握。所以大多公司的数据查询方式是业务人员通过提交查询申请，由专业数据查询人员完成数据查询任务，再反馈相应结果。自然语言是人类使用最多、最为方便的交流工具，因此通过自然语言直接和计算机进行交互，获取数据库查询结果，可以使没有数据库知识的用户也可以直接查询数据库，从而大大提高工作效率。
技术实现思路
针对相关技术中翻译准确率低、模型迭代优化速度慢、对翻译得到的语句的表达逻辑和内容的检查修正操作具有不可控性的问题，本专利技术提出一种支持自然语言的数据查询方法和系统，能够解决上述技术问题。本专利技术的技术方案是这样实现的：根据本专利技术的一个方面，提供了一种支持自然语言的数据查询方法，包括：接收用户自然语言查询语句；基于翻译模型建立所述自然语言查询语句翻译转换为目标标准SQL语句；判断能否获得所述目标标准SQL...

【技术保护点】
1.一种支持自然语言的数据查询方法，其特征在于，包括：接收用户自然语言查询语句；基于翻译模型建立所述自然语言查询语句翻译转换为目标标准SQL语句；判断能否获得所述目标标准SQL语句；若能，则基于所述目标标准SQL语句输出数据查询结果；若不能，则提示用户重新输入其它的自然语言查询语句，并且对所述翻译模型进行模型训练优化。

【技术特征摘要】
1.一种支持自然语言的数据查询方法，其特征在于，包括：接收用户自然语言查询语句；基于翻译模型建立所述自然语言查询语句翻译转换为目标标准SQL语句；判断能否获得所述目标标准SQL语句；若能，则基于所述目标标准SQL语句输出数据查询结果；若不能，则提示用户重新输入其它的自然语言查询语句，并且对所述翻译模型进行模型训练优化。2.根据权利要求1所述的方法，其特征在于，在基于翻译模型将所述自然语言查询语句翻译转换为目标标准SQL语句的步骤中，包括：将所述自然语言查询语句中的时间和条件属性通过精确匹配方式进行提取后翻译转换为第一字段，将所述自然语言查询语句的剩余部分在所述翻译模型中进行翻译转换为第二字段，拼接所述第一字段和所述第二字段以获得所述目标标准SQL语句。3.根据权利要求2所述的方法，其特征在于，在拼接所述第一字段和所述第二字段以获得所述目标标准SQL语句的步骤前，包括字段检验、纠错和去重。4.根据权利要求1所述的方法，其特征在于，对所述翻译模型进行模型训练优化包括数据集准备、模型输入数据准备、模型训练、获得实验结果。5.根据权利要求4所述的方法，其特征在于，所述模型训练包括：创建所述翻译模型，初始化相关超参数；将所述自然语言查询语句输入训练集和测试集，并将所述自然语言查询语句按照长度放入Bucket；对所述自然语言查询语句的样本进行训练，观察所述翻译模型混淆度，其中，所述混淆度越接近于1，表示模型损失函数值接近于0；调整网络的各个所述超参数，如果混淆度值在最近3次迭代中没有降低，则减小学习率；记录每一次的训练结果，将产生最优结果的所述翻译模型保存。6.一种支持自然语言的数据查询系统，其特征...

【专利技术属性】
技术研发人员：周晔，穆海洁，熊怡，
申请(专利权)人：上海汇付数据服务有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人