【技术实现步骤摘要】
预测语句执行时间范围的方法、装置、处理器及电子设备
[0001]本专利技术涉及数据处理
、
金融科技领域或其他相关领域,具体而言,涉及一种预测语句执行时间范围的方法
、
装置
、
处理器及电子设备
。
技术介绍
[0002]目前,大数据批量作业的性能对核心系统的可用率至关重要,因此在投入生产之前,有必要提供有效的分析手段来保证性能测试的质量,如,结构化查询语句
Hive SQL
由于没有类似的查询语句分析工具,且在实际使用中很少创建索引的缘故,对性能问题的定位更加困难,因此需要一种高效灵活的研判方式加以替代
。
但是,采用相关技术中提供的方法,在对查询语句的执行时间范围进行预测时,存在的预测准确率低的技术问题
。
[0003]针对所述的问题,目前尚未提出有效的解决方案
。
技术实现思路
[0004]本专利技术实施例提供了一种预测语句执行时间范围的方法
、
装置
、r/>处理器及电子设本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种预测语句执行时间范围的方法,其特征在于,包括:接收对目标结构化查询语句的预测请求;响应于所述预测请求,执行下述预测步骤,得到所述目标结构化查询语句的目标执行时间范围:转换所述目标结构化查询语句,得到结构化数据;提取所述结构化数据的数据特征;依据所述数据特征,预测执行所述目标结构化查询语句的执行时间范围,得到所述目标结构化查询语句的所述目标执行时间范围
。2.
根据权利要求1所述的方法,其特征在于,所述响应于所述预测请求,执行下述预测步骤,得到所述目标结构化查询语句的目标执行时间范围,包括:响应于所述预测请求,通过目标预测模型执行所述预测步骤,得到所述目标结构化查询语句的所述目标执行时间范围
。3.
根据权利要求2所述的方法,其特征在于,所述方法还包括:采用以下方式通过样本数据对初始模型进行训练,得到所述目标预测模型:获取所述初始模型,以及用于模型训练的所述样本数据,其中,所述样本数据包括:第一目标样本,第二目标样本,与所述第一目标样本对应的预测执行时间范围,与所述第二目标样本对应的预测执行时间范围,所述第一目标样本为基于第一初始样本得到的目标样本,所述第二目标样本为基于第二初始样本得到的目标样本,所述第一初始样本为属于第一类别的样本,且所述第一初始样本的数量低于预定阈值,所述第二初始样本为属于第二类别的样本,且所述第二初始样本的数量高于所述预定阈值,所述第一类别与所述第二类别均为与执行时间范围相关的类别;采用所述样本数据对所述初始模型进行训练,得到所述目标预测模型
。4.
根据权利要求3所述的方法,其特征在于,所述方法还包括:采用以下方式获取所述第一目标样本,所述第二目标样本:获取所述第一初始样本以及所述第二初始样本;依据所述第一初始样本,合成补充样本;依据所述第一初始样本与所述补充样本,确定所述第一目标样本,并从所述第二初始样本中抽取出所述第二目标样本
。5.
根据权利要求1所述的方法,其特征在于,所述转换所述目标结构化查询语句,得...
【专利技术属性】
技术研发人员:周唐麟,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。