【技术实现步骤摘要】
HiveSQL脚本参数优化方法、装置、计算机设备及存储介质
[0001]本申请涉及大数据
,尤其涉及HiveSQL脚本参数优化方法、装置、计算机设备及存储介质。
技术介绍
[0002]在大数据
中,Hive是一种底层封装了Hadoop的数据仓库处理工具,使用类SQL脚本语言的HiveSQL脚本语言实现数据查询。
[0003]Hive自带了大量的优化参数,通过调整该优化参数可以对HiveSQL的执行结果产生影响,而大数据开发人员需要凭借经验设置合理的优化参数才能达到优化效果,导致现有HiveSQL脚本参数优化和验证方式效率低且不稳定。
技术实现思路
[0004]本申请实施例提供一种HiveSQL脚本参数优化方法、装置、计算机设备及存储介质,以解决现有HiveSQL脚本参数优化和验证方式效率低且不稳定问题。
[0005]本申请的第一方面,提供一种HiveSQL脚本参数优化方法,包括:
[0006]获取目标系统的HiveSQL脚本,以及所述HiveSQL脚本对应的执行计划和执行时间;
[0007]获取目标编码参数,其中,所述目标编码参数是使用预设第一编码方法对第一目标参数进行编码得到的,所述第一目标参数是从所述HiveSQL脚本中获得的;
[0008]获取目标训练样本数据,其中,所述目标训练样本数据是使用预设第二编码方法对所述HiveSQL脚本的所述第一目标参数、所述执行计划和所述执行时间进行编码得到的;
[0009]获取目标适应度计算模型,其中, ...
【技术保护点】
【技术特征摘要】
1.一种HiveSQL脚本参数优化方法,其特征在于,包括:获取目标系统的HiveSQL脚本,以及所述HiveSQL脚本对应的执行计划和执行时间;获取目标编码参数,其中,所述目标编码参数是使用预设第一编码方法对第一目标参数进行编码得到的,所述第一目标参数是从所述HiveSQL脚本中获得的;获取目标训练样本数据,其中,所述目标训练样本数据是使用预设第二编码方法对所述HiveSQL脚本的所述第一目标参数、所述执行计划和所述执行时间进行编码得到的;获取目标适应度计算模型,其中,所述目标适应度计算模型是使用所述目标训练样本数据训练预设适应度计算模型得到的,所述预设适应度计算模型使用随机森林算法构建,所述预设适应度计算模型接收所述目标训练样本数据,以及输出所述目标训练样本数据对应的适应度数据;将优化后的目标HiveSQL脚本输入至所述目标适应度计算模型,获取所述目标适应度计算模型输出的目标HiveSQL脚本的优化适应度数据,其中,所述优化后的目标HiveSQL脚本是使用预设演化算法优化目标HiveSQL脚本的第二目标参数得到的;获取所述目标HiveSQL脚本的参数优化结果,其中,所述参数优化结果是在第一预设演化代数内且变化在预设适应度变化范围内的所述优化适应度数据对应的所述第二目标参数。2.根据权利要求1所述的HiveSQL脚本参数优化方法,其特征在于,所述预设适应度计算模型包含适应度计算公式,所述适应度计算公式如下:f
n
=1
‑
(T
n
/T0)其中,f
n
为所述适应度,T0表示被计算的所述HiveSQL脚本不使用Hive数据仓库工具提供的优化参数的执行耗时,T
n
表示被计算的所述HiveSQL脚本经过参数优化后的执行耗时。3.根据权利要求1所述的HiveSQL脚本参数优化方法,其特征在于,所述使用预设第一编码方法对第一目标参数进行编码包括:获取所述HiveSQL脚本中的所述第一目标参数,所述第一目标参数的类型包括布尔类型和非布尔类型;将布尔类型的所述第一目标参数转换为0或1,其中true对应1,false对应0;将非布尔类型的所述第一目标参数转换成预设参数数量的参数值,其中,所述参数值位于预设目标参数区间内。4.根据权利要求1所述的HiveSQL脚本参数优化方法,其特征在于,所述使用预设第二编码方法对所述HiveSQL脚本的所述第一目标参数、所述执行计划和所述执行时间进行编码包括:将所述HiveSQL脚本对应的所述执行计划转换为对应的样本执行向量;将所述HiveSQL脚本中的所述第一目标参数转换为样本编码参数;获取所述HiveSQL脚本的执行时间降低率,其中,所述执行时间降低率是所述HiveSQL脚本的所述执行时间相对于所述HiveSQL脚本不使用Hive数据仓库工具提供的优化参数执行的耗时的降低率;将所述样本执行向量和所述样本编码参数作为所述目标训练样本数据中的维度数据,将所述执行时间降低率作为所述目标训练样本数据中的标签数据。5.根据权利要求1所述的HiveSQL脚本参数优化方法,其特征在于,所述获取所述目标
HiveSQL脚本的...
【专利技术属性】
技术研发人员:吴瑞,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。