一种基于使用场景的SQL语句智能补全方法技术

技术编号：24996876 阅读：53 留言：0更新日期：2020-07-24 17:59

本发明专利技术提供一种基于使用场景的SQL语句智能补全方法，属于数据处理技术领域，在用户输入层与数据库语法解析层(PARSE)之间添加了一个自然语言处理模型，采用当前处于业界前沿的BERT模型，通过用户持续地输入来学习并训练模型，当数据量足够大的时候，便可给出较为精准的基于用户使用场景的SQL语句预测及补全。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于使用场景的SQL语句智能补全方法
本专利技术涉及数据库中的数据处理技术，尤其涉及一种基于使用场景的SQL语句智能补全方法。
技术介绍
利用已有的SQL语法和数据库中各种表单的数据进行SQL补全在应用环境中是常见的，也是较为必要的，因为可以省去输入复杂名称及拼写错误的麻烦。目前应用环境中常见的SQL补全方法基本包含以下几种功能：1.根据SQL输入历史进行提示：当用户输入完整SQL语句的前几个单词时，会在输入历史中进行检索，并给出使用频次最高的几个选项供用户进行选择。2.根据表单中的数据进行补全：例如用户想要向一张表中的某几列插入数据，例如insertintotest(id,name,age)values...当表中有很多列属性的时候，手动输入无疑是费力并且容易出错误的，该方法可以将表单中的列全部呈现给用户，供用户选择。3.内置代码段提示：该方法通过提前为许多常用SQL语法定义缩写，来实现简便用户输入的目的。例如当用户输入ssf，该方法就会给出SELECT*FROM的提示，用户可以自定义缩写来实现个性化的需求来弥补原生方...

【技术保护点】
1.一种基于使用场景的SQL语句智能补全方法，其特征在于，/n在用户输入层与数据库语法解析层之间添加BERT模型，通过用户持续地输入来学习并训练模型，即给出基于用户使用场景的SQL语句预测及补全。/n

【技术特征摘要】
1.一种基于使用场景的SQL语句智能补全方法，其特征在于，
在用户输入层与数据库语法解析层之间添加BERT模型，通过用户持续地输入来学习并训练模型，即给出基于用户使用场景的SQL语句预测及补全。

2.根据权利要求1所述的方法，其特征在于，
步骤如下：
S1、获取语料，语料是一个文本集，来源为原生SQL语法和用户自定义输入的SQL语句；
S2、语料预处理；
S3、特征工程；
S4、特征选择；
S5、模型训练；
S6、评价指标；
S7、SQL智能预测及补全。

3.根据权利要求2所述的方法，其特征在于，
所述语料预处理包括四个步骤：
1)语料清洗：删掉噪音数据；采用编写脚本或者代码批处理SQL语句，规则提取内容；
2)分词：将SQL语句分解成逐个词语；
3)词性标注：给分词后的词语逐个打标签；
4)去停用词：去掉对文本特征没有作用的字词。

4.根据权利要求2所述的方法，其特征在于，
所述特征工程：
将步骤S2中得到的词语表示成计算机可以识别并计算的类型；使用Word2Vec工...

【专利技术属性】
技术研发人员：王世航，季业，刘阳，陈明松，张豪，刘壮，
申请(专利权)人：山东汇贸电子口岸有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人