【技术实现步骤摘要】
HQL脚本校验方法及装置
本申请涉及数据处理
,特别涉及大数据
,具体涉及HQL脚本校验方法及装置。
技术介绍
企业的大数据服务云平台为各类专业大数据分析应用提供数据接入、存储、计算、安全管理、资源管理等服务,随着平台构建的不断完善,其技术体系日益庞大,承载的业务功能日益丰富,在平台运维体系不断扩大的同时,各大企业将大数据视作战略资源,Hadoop生态系统的应用范围愈发广泛,越来越多的分析人员基于Hive组件的HQL语句进行相关专业领域的灵活查询、分析建模,不仅HQL语句语法的正确性成为相关分析人员需要重点关注的技术问题,各个应用场景的具体模型和逻辑在新技术架构下的性能表现逐渐成为产品研发流程关注的焦点之一。目前,对HQL脚本进行校验的具体方式为:各开发人员需要通过HQL脚本对数据湖或数据仓库中的基础数据或主题数据进行业务逻辑加工等关联操作,由于编写HQL脚本的开发人员编码风格各异,同时对于HQL语法的掌握水平参差不齐,在各项目开发过程中会掺杂各种低效写法导致作业运行效率缓慢,同时消耗大数据分布式集群资源 ...
【技术保护点】
1.一种HQL脚本校验方法,其特征在于,包括:/n拆分HQL脚本以得到所述HQL脚本对应的各个目标语句,并对各个所述目标语句分别进行语法校验;/n以及,基于预设的性能隐患语法规则对所述HQL脚本进行性能隐患排查处理。/n
【技术特征摘要】
1.一种HQL脚本校验方法,其特征在于,包括:
拆分HQL脚本以得到所述HQL脚本对应的各个目标语句,并对各个所述目标语句分别进行语法校验;
以及,基于预设的性能隐患语法规则对所述HQL脚本进行性能隐患排查处理。
2.根据权利要求1所述的HQL脚本校验方法,其特征在于,所述对各个所述目标语句分别进行语法校验,包括:
基于预设的语句加工规则将各个所述目标语句分别转化为执行计划语句;
根据各个所述目标语句各自对应在分布式集群中的执行路径,在该分布式集群中对各个所述执行计划语句分别进行语法校验,以得到所述HQL脚本对应的语法校验结果。
3.根据权利要求2所述的HQL脚本校验方法,其特征在于,所述在该分布式集群中对各个所述执行计划语句分别进行语法校验,以得到所述HQL脚本对应的语法校验结果,包括:
基于各个所述目标语句各自对应的用户登陆信息登陆所述分布式集群;
将各个所述执行计划语句提交至所述分布式集群进行语法校验,以得到该分布式集群生成的所述HQL脚本对应的语法校验结果。
4.根据权利要求1所述的HQL脚本校验方法,其特征在于,所述性能隐患语法规则包括:全表扫描和全表插入规则;
所述基于预设的性能隐患语法规则对所述HQL脚本进行性能隐患排查处理,包括:
基于所述全表扫描和全表插入规则对属于分区表且未做分区字段筛选的HQL脚本进行全表扫描,以得到对应的全表扫描结果;
生成包含有所述全表扫描结果的性能隐患排查结果。
5.根据权利要求1所述的HQL脚本校验方法,其特征在于,所述性能隐患语法规则包括:笛卡尔积查询规则;<...
【专利技术属性】
技术研发人员:王泽普,张世瑛,赵吉昆,梁晔华,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。