【技术实现步骤摘要】
一种流数据任务调度方法和装置
本申请涉及计算机
,尤其涉及一种流数据任务调度方法和装置。
技术介绍
流数据(又可称为流式数据),指顺序、大量、快速、连续到达数据处理节点(可以具体为计算机、计算机集群等)的数据序列。流数据通常由大量数据源持续生成,可以理解为一个随时间延续而无限增长的动态数据集合。在很多应用场景中,例如,日志审计、性能数据监控、网络监控、传感器网络、航空航天、气象测控、金融服务等,JStorm、Flink等实时流数据处理平台均可广泛应用。但是,由于流数据会持续不间断的大量产生,因此,流数据处理平台(也可称为流数据处理系统)将需要长时间、不间断地运行,以处理流数据任务(又可称为流计算作业)。因此,亟需一种能够在流数据任务的处理过程出现异常时进行任务调度的方法,以降低人工维护成本,提高流数据处理平台的稳定性。
技术实现思路
本申请实施例提供一种流数据任务调度方法和装置,用于在流数据任务的处理过程出现异常时进行任务调度,旨在降低人工维护成本,提高流数据处理系统的稳定性。本申请实施例采用下述技术方案:第一方面,本申请实施例提供一种流数据任务调度方法,应用于任务调度系统,所述任务调度系统用于调度流数据任务,所述流数据任务由流数据处理系统处理,其中,所述方法包括:基于目标任务的任务状态参数和目标节点的节点状态参数,确定目标集群的集群运行参数;基于所述任务状态参数和所述集群运行参数中至少一项,确定所述目标任务的调度状态;基于所述目标任务 ...
【技术保护点】
1.一种流数据任务调度方法,应用于任务调度系统,所述任务调度系统用于调度流数据任务,所述流数据任务由流数据处理系统处理,其中,所述方法包括:/n基于目标任务的任务状态参数和目标节点的节点状态参数,确定目标集群的集群运行参数;/n基于所述任务状态参数和所述集群运行参数中至少一项,确定所述目标任务的调度状态;/n基于所述目标任务的调度状态,对所述目标任务进行任务调度;/n其中,所述流数据处理系统中包含至少一个集群,所述目标集群为所述至少一个集群中任一个,所述目标任务为被分发至所述目标集群处理的流数据任务,所述目标节点为所述目标集群中的流数据处理节点。/n
【技术特征摘要】
1.一种流数据任务调度方法,应用于任务调度系统,所述任务调度系统用于调度流数据任务,所述流数据任务由流数据处理系统处理,其中,所述方法包括:
基于目标任务的任务状态参数和目标节点的节点状态参数,确定目标集群的集群运行参数;
基于所述任务状态参数和所述集群运行参数中至少一项,确定所述目标任务的调度状态;
基于所述目标任务的调度状态,对所述目标任务进行任务调度;
其中,所述流数据处理系统中包含至少一个集群,所述目标集群为所述至少一个集群中任一个,所述目标任务为被分发至所述目标集群处理的流数据任务,所述目标节点为所述目标集群中的流数据处理节点。
2.根据权利要求1所述方法,其中,在基于目标任务的任务状态参数和目标节点的节点状态参数,确定目标集群的运行参数之前,所述方法还包括以下至少一项:
根据所述目标任务中数据过满队列的数量、所述目标任务中流数据的持续堆积时间和所述目标任务的处理状态中至少一项,确定所述任务状态参数;
根据所述目标节点的内存状态、无效数据回收状态和节点连通状态中至少一项,确定所述节点状态参数。
3.根据权利要求2所述方法,其中,所述方法还包括以下至少一项:
根据所述目标任务中数据过满队列的数量,确定负载指数,所述负载指数与所述数据过满队列的数量负相关;
根据所述目标任务中流数据的持续堆积时间,确定堆积指数,所述堆积指数与所述持续堆积时间负相关;
根据所述目标任务的处理状态,确定状态指数,其中,所述处理状态为正常处理时,所述状态指数取为预设上限值,所述处理状态为处理失败时,所述状态指数取为预设下限值。
4.根据权利要求3所述方法,其中,根据所述目标任务中数据过满队列的数量、所述目标任务中流数据的持续堆积时间和所述目标任务的处理状态中至少一项,确定所述任务状态参数,包括:
对所述负载指数、所述堆积指数和所述状态指数进行加权计算,得到所述任务状态参数。
5.根据权利要求4所述方法,其中,对所述负载指数、所述堆积指数和所述状态指数进行加权计算时,所述负载指数的权重、所述堆积指数的权重和所述状态指数的权重依次递增。
6.根据权利要求2所述方法,其中,所述方法还包括:
根据所述目标节点的可用内存量,确定内存指数,所述内存指数与所述可用内存量正相关;
根据所述无效数据回收的消耗时长,确定回收指数,所述回收指数与所述消耗时长负相关;
根据所述目标节点的节点连通状态,确定连通指数,其中,所述节点连通状态为正常连通时,所述连通指数取为预设上限值,所述节点连通状态为连通失败时,所述连通指数取为预设下限值。
7.根据权利要求6所述方法,其中,根据所述目标节点的内存状态、无效数据回收状态和节点连通状态中至少一项,确定所述节点状态参数,包括:
对所述内存指数、所述回收指数和所述连通指数进行加权计算,得到所述节点状态参数。
8.根据权利要求7所述方法,其中,对所述内存指数、所述回收指数和所述连通指数进行加权计算时,所述内存指数的权重、所述回收指数的权重和所述连通指数的权重依次递增。
9.根据权利要求1~8之任一所述方法,其中,基于目标任务的任务状态参数和目标节点的节点状态参数,确定目标集群的集群运行参数,包括:
基于所述任务状态参数,确定所述目标任务中异常任务的数量;
根据所述异常任务的数量,确定所述目标集群的作业运行参数,所述作业运行参数与所述异常任务的数量负相关;
基于所述节点状态参数,确定所述目标节点中异常节点的数量;
根据所述异常节点的数量,确定所述目标集群的节点运行参数,所述节点运行参数与所述异常节点的数量负相关;
基于所述作业运行参数和所述节点运行参数,确定所述目标集群的集群运行参数。
10.根据权利要求9所述方法,其中,基于所述作业运行参数和所述节点运行参数,确定所述目标集群的集群运行参数,包括:
对所述作业运行参数和所述节点运行参数进行加权计算,得到所述目标集群的集群运行参数。
11.根据权利要求10所述方法,其中,在对所述作业运行参数和所述节点运行参数进行加权计算时,所述作业运行参数的权重小于所述节点运行参数的权重。
12.根据权利要求1所述方法,其中,基于所述任务状态参数,确定所述目标任务的调度状态,包括以下至少一项:
在目标任务的任务状态参数小于或等于预设阈值的情况下,若该目标任务的负载指数或者堆积指数小于预设数值,则确定该目标任务的调度状态为待扩容状态;
在目标任务的任务状态参数小于或等于预设阈值的情况下,确定该目标任务的调度状态为待迁移状态。
13.根据权利要求1所述方法,其中,基于所述集群运行参数,确定所述目标任务的调度状态,包括:
在目标集群的集...
【专利技术属性】
技术研发人员:王煜骢,酆晓杰,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。