基于NL2SQL的BI查询方法、装置、设备及介质制造方法及图纸

技术编号:30825577 阅读:31 留言:0更新日期:2021-11-18 12:21
本发明专利技术提供一种基于NL2SQL的BI查询方法、装置、设备及介质,所述方法包括:获取待处理文本的特征向量;根据特征向量和预设的多个表格特征向量计算相似度,根据所述相似度确定出与所述特征向量对应的第一表格;将第一表格的信息和待处理文本输入预先训练好的NL2SQL模型中,获取SQL标签数据;根据SQL标签数据确认所述待处理文本对应的查询结果;其中,NL2SQL模型是根据第一训练样本数据以及与第一训练样本数据对应的SQL标签数据进行训练得到的;其中,第一训练样本数据包括多个样本问题以及与多个样本问题对应的样本表格。本发明专利技术提供的查询方法能够提高模型解析识别的准确率和效率,提高问题查询的准确性。提高问题查询的准确性。提高问题查询的准确性。

【技术实现步骤摘要】
基于NL2SQL的BI查询方法、装置、设备及介质


[0001]本专利技术涉及数据库
,尤其涉及一种基于NL2SQL的BI查询方法、装置、设备及介质

技术介绍

[0002]随着信息化的快速发展,数据库的应用越来越普遍,人们希望根据输入的问题能够迅速从数据库中查询到相应的结果。
[0003]目前,中文NL2SQL(Natural Language to SQL)技术还尚未成熟,主要面临中文数据集缺乏、查询意图转换缺乏背景知识支撑和模型解析准确率三方面的挑战,另外,部分口语化的简称和描述加大了NL2SQL解析的难度。在企业级应用中,对用户交互有很高的要求,不仅期望能够自动匹配数据表格,对可视化图表类型的输出也有严格的要求。而现有技术中,主流的中文NL2SQL技术都是针对单表查询的,中文NL2SQL模型也都是针对开源数据集训练得到的,业务场景相对单一,表格关系和内容比较简单且局限于固定单表查询,无法动态关联到表格,也没有在企业级BI应用中实现。

技术实现思路

[0004]本专利技术提供一种基于NL2SQL的BI查询方法、装本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于NL2SQL的BI查询方法,其特征在于,包括:获取待处理文本的特征向量;其中,所述待处理文本是与输入的问题相对应的文本;根据所述特征向量和预设的多个表格特征向量计算相似度,根据所述相似度确定出与所述特征向量对应的第一表格;将所述第一表格的信息和所述待处理文本输入预先训练好的NL2SQL模型中,获取SQL标签数据;根据所述SQL标签数据确认所述待处理文本对应的查询结果;其中,所述NL2SQL模型是根据第一训练样本数据以及与所述第一训练样本数据对应的SQL标签数据进行训练得到的;其中,所述第一训练样本数据包括多个样本问题以及与所述多个样本问题对应的样本表格。2.根据权利要求1所述的基于NL2SQL的BI查询方法,其特征在于,所述根据所述SQL标签数据得到所述待处理文本对应的查询结果之后,所述方法还包括:确认所述待处理文本的关键词;将所述关键词与预设关键词库中的关键词进行匹配,确定所述待处理文本对应的图表类型;将所述查询结果通过所述图表类型进行渲染并可视化输出;或,根据图表类型的维度和指标要求设定的规则,确定所述待处理文本对应的图表类型;将所述查询结果通过所述图表类型进行渲染并可视化输出。3.根据权利要求1所述的基于NL2SQL的BI查询方法,其特征在于,在所述获取待处理样本的特征向量之前,包括:获取多个样本表格数据;对所述多个样本表格数据分别进行分词处理,得到所述多个样本表格数据各自对应的分词;基于词频

逆文档频率的方式对所述多个样本表格数据中的分词分别进行词频计算,得到所述多个样本表格数据的表格特征词;基于词向量模型对所述多个样本表格数据的表格特征词进行词向量转换与计算,得到预设的多个表格特征向量。4.根据权利要求1所述的基于NL2SQL的BI查询方法,其特征在于,在所述获取待处理文本的特征向量之前,所述方法还包括:获取第一训练样本数据以及与所述第一训练样本数据对应的SQL标签数据;其中,所述第一训练样本数据包括多个样本问题、与所述多个样本问题对应的样本表格;将所述第一训练样本数据输入第一语言模型中,获取第一任务预测值、第二任务预测值和第三任务预测值;根据所述第一任务预测值、第二任务预测值和第三任务预测值以及所述SQL标签数据,得到所述第一语言模型的第一损失函数值;当所述第一损失函数值满足预设条件时,确定所述第一语言模型为第一子模型。5.根据权利要求4所述的基于NL2SQL的BI查...

【专利技术属性】
技术研发人员:王攀峰阮东东罗义
申请(专利权)人:北京仁科互动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1