【技术实现步骤摘要】
基于数据湖查询权限点的提取方法、装置、设备及介质
[0001]本公开涉及数据安全
,具体涉及一种基于数据湖查询权限点的提取方法、装置、设备及介质。
技术介绍
[0002]在数据湖场景中,数据通常会按照一定的规则以表的形式结构化的组织在一起。一个表就是一个关系,表实质上就是行、列的集合,针对于数据湖的权限管控也可以进一步细分为库权限、表权限、行权限和列权限等等。
[0003]目前,通常使用结构化查询语言(Structured Query Language,SQL)对表内的数据的进行分析与处理。但是,针对于数据湖的权限点提取是基于固定的规则进行的,而用户的编写的SQL语句是多种多样的,因此基于固定规则进行权限点提取很难匹配所有类型的SQL语句,从而难以细致、精准的提取实际所要查询的库/表/行/列权限,难以进行细粒度的权限管控。
技术实现思路
[0004]有鉴于此,本公开实施例提供了一种基于数据湖查询权限点的提取方法、装置、设备及介质,以解决难以针对数据湖进行细粒度权限管控的问题。
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据湖查询权限点的提取方法,其特征在于,包括:获取查询语句对应的抽象语法树结构;提取所述抽象语法树结构中的扫描算子、列选择算子以及过滤条件算子;基于所述扫描算子,确定所要提取的库表权限点;基于所述列选择算子以及所述过滤条件算子,确定所要提取的列权限点和行权限点;将所述库表权限点、所述列权限点以及所述行权限点进行组合,确定权限点查询范围。2.根据权利要求1所述的方法,其特征在于,所述基于所述扫描算子,确定所要提取库表权限点,包括:基于所述扫描算子从所述抽象语法树结构中提取当次所要查询的数据表以及所述扫描算子对应的算子标识;按照所述数据表以及所述算子标识,确定数据表标识信息;根据所述数据表标识信息,确定当次所要鉴别的所述库表权限点。3.根据权利要求1所述的方法,其特征在于,基于所述列选择算子以及所述过滤条件算子,确定所要提取的列权限点和行权限点,包括:基于所述列选择算子,从所述抽象语法树结构中提取数据表的列信息,所述列选择算子处于所述抽象语法树结构的最外层;按照所述抽象语法树结构的数据血缘关系遍历所述列信息,确定所述列信息对应的所述列权限点;基于所述过滤条件算子对应的过滤条件,确定所述行权限点。4.根据权利要求3所述的方法,其特征在于,所述按照所述抽象语法树结构的数据血缘关系遍历所述列信息,确定所述列信息对应的列权限点,包括:按照所述抽象语法树结构的数据血缘关系遍历所述列信息,确定每列对应的目标查询算子;基于所述目标查询算子进行递归查找,定位所述列信息中每列所对应的第一血缘列,得到所述第一血缘列对应的所述列权限点。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述过滤条件算子对应的过滤条件,确定所述行权限点,包括:获取所述过滤条件的类型;当所述过滤条件的类型为列与值相等时,基于所述数据血缘关系确定所述过滤条件中的列所对应的第二血缘列;将所述第二血缘列与所述过滤条件中的值进行拼接,得到所述行权限点。6.根据权利要求3或4所述的方法,其特征在于,还包括:当所述过滤条件的类型为列与列相等时,基于所述数据血缘关系确定所述过滤条件中的列所对应的第三血缘列,得到所述第三血缘列对应的所述列权限点。7.根据权利要求1所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:朱江,郭俊,孙科,徐祎,谢佳君,罗旋,
申请(专利权)人:北京火山引擎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。