决策型分布式数据库系统中AISQL的解析器及其实现方法技术方案

技术编号:20160378 阅读:40 留言:0更新日期:2019-01-19 00:13
本发明专利技术属于支持AI SQL的SQL解析器,特别涉及一种决策型分布式数据库系统中AI SQL的解析器及其实现方法。本发明专利技术提供一种新的决策型分布式数据库系统中AI SQL的解析器及其实现方法,该决策型分布式数据库系统中AI SQL的解析器及其实现方法采用AI SQL作为SQL 2011规范的扩展,和二次开发AI分析程序相比,由于SQL语言天生声明性的特征,这使得AI SQL远比其他如Python/Java/C/C++这些要更容易掌握和使用,一般熟练掌握SQL的数据分析师即能掌握,无需增加掌握Python/Java/C/C++这些AI编程开发人员。并且AI SQL使用决策型数据作为执行平台,和二次开发AI分析程序的过程相比,减少了编译、打包、部署的环节,测试工作也更简单,从而降低了AI分析项目的人员成本和实施周期。

【技术实现步骤摘要】
决策型分布式数据库系统中AISQL的解析器及其实现方法
本专利技术属于支持AISQL的SQL解析器,特别涉及一种决策型分布式数据库系统中AISQL的解析器及其实现方法。
技术介绍
现有的SQL解析器支持标准SQL核心语法并且有各自特定的扩展功能语法,但是缺少对AI模型管理和应用相关的操作的语法解析的支持。这使得用户不得不借助于AI开发工具包来弥补这个问题,但是AI工具包均为编程API方式提供给用户,这需要用户具备某种通用编程语言(如C/C++/Python/Java)的开发能力,这些语言学习曲线明显高于声明式查询语言SQL,这对于采用SQL作为主要分析手段的传统数据分析师而言要求过于苛刻。另外AI工具进行二次开发存在编译、打包、测试、部署的问题,其项目实施成本、风险和周期远远高于传统数据分析过程。
技术实现思路
针对上述问题,本专利技术提供一种新的决策型分布式数据库系统中AISQL的解析器及其实现方法,该新的决策型分布式数据库系统中AISQL的解析器及其实现方法采用新的语法定义来实现AISQL并且对复杂的数据分析任务能够整体进行优化执行,从而节省了硬件成本。本专利技术具体技术方案如下:本本文档来自技高网...

【技术保护点】
1.一种决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述支持AI SQL的SQL解析器包括:语法定义模块(10),用于定义实现AI SQL的语法;AI SQL解析模块(20),用于解析输入的AI SQL语句,得到一颗解析好的语法树;逻辑执行计划生成模块(30),用于根据解析好的语法树新型创建逻辑执行计划。

【技术特征摘要】
1.一种决策型分布式数据库系统中AISQL的解析器,其特征在于,所述支持AISQL的SQL解析器包括:语法定义模块(10),用于定义实现AISQL的语法;AISQL解析模块(20),用于解析输入的AISQL语句,得到一颗解析好的语法树;逻辑执行计划生成模块(30),用于根据解析好的语法树新型创建逻辑执行计划。2.根据权利要求1所述的决策型分布式数据库系统中AISQL的解析器,其特征在于,所述语法定义模块(10)包括:AI模型创建的语法定义单元(101),用于对AI模型创建的语法进行定义;AI模型更新的语法定义单元(102),用于对AI模型更新的语法进行定义;AI模型评估的语法定义单元(103),用于对AI模型评估的语法进行定义;手动指令领域数据类型的语法定义单元(104),用于对手动指令领域数据类型的语法进行定义;AI模型应用的语法定义单元(105),用于对AI模型应用的语法进行定义,其中AI模型的应用是预测函数根据用户输入的数据集合、选择的建好的模型生成预测结果,所述预测结果包括:分类结果、趋势、关联关系挖掘以及推荐结果;AISQL其他语法定义单元(106),用于对ALSQL的其他语法进行定义。3.根据权利要求2所述的决策型分布式数据库系统中AISQL的解析器,其特征在于,所述AISQL解析模块(20)包括:词法分析单元(201),用于将输入的AISQL语句解析成令牌流;语法分析单元(202),用于将令牌流解析为语法树;关系表解析单元(203),用于将语法树中的关系表解析为具有元数据信息的关系表信息对象,所述元数据信息包括存储位置;AI模型解析单元(204),用于将语法树中AI模型解析为具有元数据信息的AI模型信息对象;算法解析单元(205),用于将语法树中函数的名称解析为具有完整类型信息的函数描述对象,所述函数包括AI计算函数;解析完成单元(206),用于根据上述解析得到解析好的语法树。4.根据权利要求3所述的决策型分布式数据库系统中AISQL的解析器,其特征在于,所述逻辑执行计划生成模块(30)包括:连接运算步骤生成单元(301),用于根据SQL的JOIN操作生成关系代数的连接运算步骤;集合运算步骤生成单元(302),用于根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;特征工程计算步骤生成单元(303),用于根据特征工程处理算法生成对应的特征工程计算步骤,其中,若是采用智能特征工程计算,则构造一通过与支持AISQL的SQL解析器相通讯的特征工程知识库进行匹配的系列计算步骤;AI计算步骤生成单元(304),用于根据AI计算函数生成对应的AI计算步骤,包括参数的自动转换以及根据AI算法库构造逻辑执行计划的AI计算对象,其中AI算法函数为AISQL解析模块(20)解析后得到的具有完整类型信息的函数描述对象;选择运算生成单元(305),用于根据SQL的条件过滤信息生成关系代数选择运算;投影运算生成单元(306),用于根据SQL的<selectlist>信息生成关系代数投影运算,包括表达式计算的生成;逻辑执行计划单元(307),用于根据上述运算得到一个根据语法树信息创建的逻辑执行计划,所述逻辑执行计划为一系列关系代数运算或AI运算。5.根据权利要求4所述的决策型分布式数据库系统中AISQL的解析器,其特征在于,所述AISQL解析模块(20)还包括:验证及定位单元(207),用于调取与支持AISQL的SQL解析器相通讯的关系表及AI模型元数据...

【专利技术属性】
技术研发人员:张德辉
申请(专利权)人:北京聚云位智信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1