【技术实现步骤摘要】
一种基于使用场景的SQL语句智能补全方法
本专利技术涉及数据库中的数据处理技术,尤其涉及一种基于使用场景的SQL语句智能补全方法。
技术介绍
利用已有的SQL语法和数据库中各种表单的数据进行SQL补全在应用环境中是常见的,也是较为必要的,因为可以省去输入复杂名称及拼写错误的麻烦。目前应用环境中常见的SQL补全方法基本包含以下几种功能:1.根据SQL输入历史进行提示:当用户输入完整SQL语句的前几个单词时,会在输入历史中进行检索,并给出使用频次最高的几个选项供用户进行选择。2.根据表单中的数据进行补全:例如用户想要向一张表中的某几列插入数据,例如insertintotest(id,name,age)values...当表中有很多列属性的时候,手动输入无疑是费力并且容易出错误的,该方法可以将表单中的列全部呈现给用户,供用户选择。3.内置代码段提示:该方法通过提前为许多常用SQL语法定义缩写,来实现简便用户输入的目的。例如当用户输入ssf,该方法就会给出SELECT*FROM的提示,用户可以自定义缩写来实现个性化的需求来弥补原生方 ...
【技术保护点】
1.一种基于使用场景的SQL语句智能补全方法,其特征在于,/n在用户输入层与数据库语法解析层之间添加BERT模型,通过用户持续地输入来学习并训练模型,即给出基于用户使用场景的SQL语句预测及补全。/n
【技术特征摘要】
1.一种基于使用场景的SQL语句智能补全方法,其特征在于,
在用户输入层与数据库语法解析层之间添加BERT模型,通过用户持续地输入来学习并训练模型,即给出基于用户使用场景的SQL语句预测及补全。
2.根据权利要求1所述的方法,其特征在于,
步骤如下:
S1、获取语料,语料是一个文本集,来源为原生SQL语法和用户自定义输入的SQL语句;
S2、语料预处理;
S3、特征工程;
S4、特征选择;
S5、模型训练;
S6、评价指标;
S7、SQL智能预测及补全。
3.根据权利要求2所述的方法,其特征在于,
所述语料预处理包括四个步骤:
1)语料清洗:删掉噪音数据;采用编写脚本或者代码批处理SQL语句,规则提取内容;
2)分词:将SQL语句分解成逐个词语;
3)词性标注:给分词后的词语逐个打标签;
4)去停用词:去掉对文本特征没有作用的字词。
4.根据权利要求2所述的方法,其特征在于,
所述特征工程:
将步骤S2中得到的词语表示成计算机可以识别并计算的类型;使用Word2Vec工...
【专利技术属性】
技术研发人员:王世航,季业,刘阳,陈明松,张豪,刘壮,
申请(专利权)人:山东汇贸电子口岸有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。