结构化查询语言数据的解析方法、装置和电子设备制造方法及图纸

技术编号:33962682 阅读:49 留言:0更新日期:2022-06-30 00:50
本公开提供了一种结构化查询语言数据的解析方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及大数据、数据治理和数据血缘分析等技术领域,可应用于云计算场景下。具体实现方案为:对结构化查询语言数据进行解析,得到抽象语法树;根据抽象语法树,确定表信息和字段信息;根据表信息和字段信息,确定原始血缘树;以及根据元数据,对原始血缘树进行扩展,得到目标血缘树,作为解析结果。作为解析结果。作为解析结果。

【技术实现步骤摘要】
结构化查询语言数据的解析方法、装置和电子设备


[0001]本公开涉及计算机
,尤其涉及大数据、数据治理和数据血缘分析等
,可应用于云计算场景下。

技术介绍

[0002]数据血缘属于数据治理中的一个概念,是指在数据溯源的过程中找到相关数据之间的联系。数据治理时需要针对数据进行血缘分析,以便得到数据血缘。血缘分析是保证数据融合的一个手段,通过血缘分析可以实现数据融合处理过程的可追溯。

技术实现思路

[0003]本公开提供了一种结构化查询语言数据的解析方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种结构化查询语言数据的解析方法,包括:对结构化查询语言数据进行解析,得到抽象语法树;根据所述抽象语法树,确定表信息和字段信息;根据所述表信息和所述字段信息,确定原始血缘树;以及根据元数据,对所述原始血缘树进行扩展,得到目标血缘树,作为解析结果。
[0005]根据本公开的另一方面,提供了一种结构化查询语言数据的解析装置,包括:解析模块,用于对结构化查询语言数据进行解析,得到抽象语法树;第一确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种结构化查询语言数据的解析方法,包括:对结构化查询语言数据进行解析,得到抽象语法树;根据所述抽象语法树,确定表信息和字段信息;根据所述表信息和所述字段信息,确定原始血缘树;以及根据元数据,对所述原始血缘树进行扩展,得到目标血缘树,作为解析结果。2.根据权利要求1所述的方法,其中,所述对结构化查询语言数据进行解析,得到抽象语法树,包括:将所述结构化查询语言数据拆分为多个语法单元;对所述多个语法单元进行语法分析,得到所述多个语法单元之间的上下文关系;根据所述多个语法单元,确定所述抽象语法树中的多个语法节点;以及根据所述多个语法单元之间的上下文关系,确定所述多个语法节点之间的层级关系。3.根据权利要求2所述的方法,其中,其中,所述根据所述抽象语法树,确定表信息和字段信息,包括:根据所述抽象语法树,确定所述结构化查询语言数据中用于数据选取的多个目标语句块;以及提取所述多个目标语句块中的表信息和字段信息。4.根据权利要求3所述的方法,其中,所述根据所述抽象语法树,确定所述结构化查询语言数据中用于数据选取的多个目标语句块,包括:确定所述抽象语法树中与数据选取相关的多个目标分支以及所述多个目标分支之间的层级关系;以及根据所述多个目标分支中的语法节点,确定所述多个目标语句块。5.根据权利要求1所述的方法,其中,所述根据所述表信息和所述字段信息,确定原始血缘树,包括:根据所述表信息和所述字段信息,确定所述原始血缘树中的多个表节点;以及根据与所述表信息和所述字段信息对应的目标语句块之间的层级关系,确定所述多个表节点之间的层级关系。6.根据权利要求3所述的方法,其中,所述目标语句块包括主语句块和数据表语句块;所述提取所述多个目标语句块中的表信息和字段信息包括:提取所述主语句块中的表信息和字段信息;以及提取所述数据表语句块中的表信息。7.根据权利要求6所述的方法,其中,所述目标语句块还包括附属语句块,其中,所述附属语句块包括子查询语句块、主合并语句块、子合并语句块、主复用查询语句块和子复用查询语句块...

【专利技术属性】
技术研发人员:贺斌任启强姚利
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1