【技术实现步骤摘要】
作业运行时长确定方法、装置、设备及存储介质
[0001]本申请实施例涉及人工智能
,涉及但不限于一种作业运行时长确定方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]作业(job)是指用户在一次事务解决或是一个事务处理过程中要求计算机系统所做的工作的集合。作业的运行时长受多种因素的影响,例如,运行作业的集群中的机器个数、作业的提交时刻和运行时刻等。
[0003]目前,在分析不同因素对作业运行时长的影响时,通常是采用统计学的方法,手动调整每个时间段的机器个数,来观察调整后的机器个数对作业运行时长的影响,也就是说需要人工调整不同影响因素的数值,并需要全面地采集数据,在每天的每个时刻都要控制调整影响因素的数值来进行分析。
[0004]显然,相关技术中通过人工分析的方法数据量太大,且分析难度较大,因此,对作业在不用因素影响下的作业运行时长的分析准确率较低。
技术实现思路
[0005]本申请实施例提供一种作业运行时长确定方法、装置、设备及存储介质,至少应用于人工智能
,能够得到特征信息与运行时长之间准确的对应关系,从而基于该对应关系,准确且高效的分析出不同特征信息对作业运行时长的影响,提高分析的效率和准确性。
[0006]本申请实施例的技术方案是这样实现的:
[0007]本申请实施例提供一种作业运行时长确定方法,所述方法包括:
[0008]获取目标作业在预设历史时间段内的历史数据;从所述历史数据中,确定出属于预设类型的特征信息;对所述特征信息进行数 ...
【技术保护点】
【技术特征摘要】
1.一种作业运行时长确定方法,其特征在于,所述方法包括:获取目标作业在预设历史时间段内的历史数据;从所述历史数据中,确定出属于预设类型的特征信息;对所述特征信息进行数据统计,得到统计特征信息;基于所述历史数据中的历史运行时长,对所述特征信息和所述统计特征信息进行分布式梯度增强分析,得到特征信息与运行时长的对应关系;基于所述对应关系,确定待分析作业在目标特征信息下的作业运行时长。2.根据权利要求1所述的方法,其特征在于,所述从所述历史数据中,确定出属于预设类型的特征信息,包括:从所述历史数据中,筛选出所述目标作业的自身属性特征、所述目标作业的提交时刻、运行所述目标作业的集群特征和所述目标作业的运行时间内其他作业的特征;将所述自身属性特征、所述提交时刻、所述集群特征和所述其他作业的特征,确定为属于预设类型的特征信息。3.根据权利要求2所述的方法,其特征在于,所述对所述特征信息进行数据统计,得到统计特征信息,包括:针对所述目标作业的运行时间中的特定时间段,获取所述特定时间段内多个其他作业对应的特征集合;对所述特征集合中的特征数据进行统计学分析,得到其他作业的数量统计值、其他作业已使用的机器核数统计值和其他作业已使用的内存统计值;其中,所述其他作业的数量统计值、所述其他作业已使用的机器核数统计值和所述其他作业已使用的内存统计值构成所述统计特征信息。4.根据权利要求3所述的方法,其特征在于,所述目标作业的提交时刻包括以下至少之一:提交日期值、提交小时值和提交分钟值;所述对所述特征信息进行数据统计,得到统计特征信息,还包括:分别基于所述提交日期值、提交小时值和提交分钟值,对所述自身属性特征、所述提交时刻、所述集群特征和所述其他作业的特征依次进行聚合处理,得到聚合后的自身属性特征、聚合后的提交时刻、聚合后的集群特征和聚合后的其他作业的特征;基于所述提交日期值,依次对所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征进行统计学分析,对应得到所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征分别在日期维度的第一变化规律;基于所述提交小时值,依次对所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征进行统计学分析,对应得到所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征,分别在小时维度的第二变化规律;基于所述提交分钟值,依次对所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征进行统计学分析,对应得到所述聚合后的自身属性特征、所述聚合后的提交时刻、所述聚合后的集群特征和所述聚合后的其他作业的特征分别在分钟维度的第三变化规律;
其中,所述第一变化规律、所述第二变化规律和所述第三变化规律中的至少之一构成所述统计特征信息。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述特征信息和所述统计特征信息中的每一特征数据的波动值和方差;将所述波动值小于波动阈值且所述方差小于方差阈值的特征数据确定为目标剔除数据;从所述特征信息和所述统计特征信息中剔除所述目标剔除数据。6.根据权利要求1所述的方法,其特征在于,所述基于所述历史数据中的历史运行时长,对所述特征信息和所述统计特征信息进行分布式梯度增强分析,得到特征信息与运行时长的对应关系,包括:对所述特...
【专利技术属性】
技术研发人员:蒙权,林金泉,马天,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。