The invention discloses a metadata reading method and device based on Hive data warehouse. The method includes: receiving the reading request for carrying keyword segments sent by the security management and control system; determining whether the corresponding metadata of the keyword segments is stored in the local cache; and sending the metadata corresponding to the keyword segments to the security management and control system if it is determined that the corresponding metadata of the keyword segments is stored in the local cache. A read response carrying metadata corresponding to the keyword segment is sent; if it is determined that the metadata corresponding to the keyword segment is not stored in the local cache, the metadata corresponding to the keyword segment is read from the Hive data warehouse in the first reading mode in effect, and a read response carrying metadata corresponding to the keyword segment is sent to the security control system. This scheme can realize efficient and convenient metadata reading mode.
【技术实现步骤摘要】
基于Hive数据仓库的元数据读取方法及装置
本专利技术涉及数据读取
,尤指一种基于Hive数据仓库的元数据读取方法及装置。
技术介绍
随着大数据技术的日益完善,越来越多的企业开始使用Hadoop平台来管理自己数据资源。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的结构化查询语言(StructuredQueryLanguage,SQL)查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。同时Hive作为Hadoop生态的一员,其拥有管理海量数据的能力,能对海量数据进行统计分析计算,满足企业相关业务需要。通常Hadoop平台会作为一个基础设施在企业范围内使用,因此Hive的安全管控显的尤为重要,比如多个部门需要使用到Hive数据仓库,其中a部门需要分析涉密数据,那么如何对Hive数据仓库进行管控,使得这些数据其他部门是无权访问的呢?为解决上述问题,需要启用一个对用户操作进行监控的框架,使每个用户的操作都在设定的权限范围内,这个框架就是---ApacheSentry。ApacheSentry是运行在Hadoop平台上的基于细粒度的数据、元数据授权框架。ApacheSentry可以和Hive数据仓库紧密结合,使得Hive数据仓库上的安全管控可以做到非常的细粒度,且配合Hive数据仓库的thrift服务易于实现安全管控业务系统。ApacheSentry的出 ...
【技术保护点】
1.一种基于Hive数据仓库的元数据读取方法,其特征在于,所述方法包括:接收安全管控系统发送的携带关键字段的读取请求;确定本地缓存中是否存储所述关键字段对应的元数据;若确定所述本地缓存中存储所述关键字段对应的元数据,则向所述安全管控系统发送携带所述关键字段对应的元数据的读取响应;若确定所述本地缓存中未存储所述关键字段对应的元数据,则以当前生效的第一读取方式从所述Hive数据仓库读取所述关键字段对应的元数据,向所述安全管控系统发送携带所述关键字段对应的元数据的读取响应。
【技术特征摘要】
1.一种基于Hive数据仓库的元数据读取方法,其特征在于,所述方法包括:接收安全管控系统发送的携带关键字段的读取请求;确定本地缓存中是否存储所述关键字段对应的元数据;若确定所述本地缓存中存储所述关键字段对应的元数据,则向所述安全管控系统发送携带所述关键字段对应的元数据的读取响应;若确定所述本地缓存中未存储所述关键字段对应的元数据,则以当前生效的第一读取方式从所述Hive数据仓库读取所述关键字段对应的元数据,向所述安全管控系统发送携带所述关键字段对应的元数据的读取响应。2.如权利要求1所述的方法,其特征在于,确定本地缓存中是否存储所述关键字段对应的元数据,具体包括:在所述本地缓存中查找所述关键字段;若在所述本地缓存中查找到所述关键字段,则确定所述本地缓存中存储所述关键字段对应的元数据;若在所述本地缓存中未查找到所述关键字段,则确定所述本地缓存中未存储所述关键字段对应的元数据。3.如权利要求1所述的方法,其特征在于,以当前生效的第一读取方式从所述Hive数据仓库读取所述关键字段对应的元数据,具体包括:获取读取方式配置文件;从所述配置文件中确定携带生效标记的第一读取方式;使用所述第一读取方式将所述关键字段发送给所述Hive数据仓库;并接收所述Hive数据仓库返回的所述关键字段对应的元数据。4.如权利要求3所述的方法,其特征在于,还包括:接收携带第二读取方式的读取方式更改指令;删除所述第一读取方式的生效标记;以及,在所述第二读取方式添加所述生效标记。5.如权利要求1-4任一所述的方法,其特征在于,以当前生效的第一读取方式从所述Hive数据仓库读取所述关键字段对应的元数据之后,还包括:将所述关键字段对应的元数据存储到所述本地缓存中。6.一种基于Hive数据仓库的元数据读取装置,其特征在于,所述装置包...
【专利技术属性】
技术研发人员:赖新明,林文辉,王杰斌,杨硕,邓应强,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。