一种任务调度方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:29672485 阅读:12 留言:0更新日期:2021-08-13 21:54
本申请公开了一种任务调度方法、装置、电子设备及计算机可读存储介质,该方法包括:若获取到任务需求,则对任务需求进行拆分,得到多个具有约束关系的子任务;对非候选子任务进行执行条件检测,将满足执行条件的非候选子任务确定为候选子任务,并将候选子任务放入任务队列;对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;将服务器状态信息、通信信息和任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;利用评估值在多个调度动作中确定目标调度动作,并基于目标调度动作对任务队列中的候选子任务进行调度;该方法提高了边缘服务器的效率,减少了完成任务需求所需要的时长。

【技术实现步骤摘要】
一种任务调度方法、装置、电子设备及可读存储介质
本申请涉及边缘计算
,特别涉及一种任务调度方法、任务调度装置、电子设备及计算机可读存储介质。
技术介绍
边缘计算(EdgeComputing,EC)技术的发展有效缓解了云计算在网络资源利用效率、用户体验质量等方面所面临的严峻挑战。然而,边缘计算正面临着用户需求响应优化方面的重要挑战。用户对网络服务的要求更加严苛,尤其是对服务响应速度、覆盖性和连通性等影响用户体验质量的方面。为了提高对用户需求的响应速度,相关技术对各个用户提交的需求在单个边缘服务器上进行调度。然而,服务业务的功能和逻辑愈加复杂多样,用户向服务网络发送的需求愈加个性化,其通常需要将不同任务进行处理和聚合,因此相关技术的调度方式仅为基于优先级进行任务调度,在大部分情况下并不是最优调度方式,使得边缘计算网络的效率较低,用户需求响应速度慢。因此,相关技术存在的边缘计算网络效率较低、用户需求响应速度慢的问题,是本领域技术人员需要解决的技术问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种任务调度方法、任务调度装置、电子设备及计算机可读存储介质,提高了边缘服务器的效率,减少了完成任务需求所需要的时长。为解决上述技术问题,本申请提供了一种任务调度方法,包括:若获取到任务需求,则对所述任务需求进行拆分,得到多个具有约束关系的子任务;对非候选子任务进行执行条件检测,将满足执行条件的所述非候选子任务确定为候选子任务,并将所述候选子任务放入任务队列;对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;将所述服务器状态信息、所述通信信息和所述任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;利用所述评估值在多个所述调度动作中确定目标调度动作,并基于所述目标调度动作对所述任务队列中的所述候选子任务进行调度。可选地,所述对非候选子任务进行执行条件检测,包括:判断所述非候选子任务是否为需求起始任务;若是所述需求起始任务,则确定所述非候选子任务满足所述执行条件;若不是所述需求起始任务,则判断所述非候选子任务的前序任务是否全部执行完毕;若所述前序任务全部执行完毕,则确定所述非候选子任务满足所述执行条件;若所述前序任务未全部执行完毕,则确定所述非候选子任务不满足所述执行条件。可选地,所述对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息,包括:对各个所述边缘服务器进行剩余计算时长检测,得到所述服务器状态信息;对所述服务器网络中的各个网络信道进行剩余传输时长检测,得到所述通信信息。可选地,所述动作价值评估模型的训练过程,包括:获取多个训练数据,并将所述训练数据分别输入初始网络,得到各个所述训练数据分别对应的多个训练评估值;利用所述训练评估值确定目标训练调度动作,并根据所述目标训练调度动作进行任务调度,并得到各个所述训练数据对应的性能参数;利用所述性能参数得到目标评估值,并利用所述训练评估值和所述目标评估值得到损失值;利用所述损失值更新所述初始网络,迭代训练得到所述动作价值评估模型。可选地,所述获取多个训练数据,包括:判断候选训练数据的数量是否达到采样阈值;若达到所述采样阈值,则利用上一训练轮次对应的所述训练数据和所述性能参数生成新的所述候选训练数据,并从所述候选训练数据中随机选择所述采样阈值个所述训练数据;若未达到所述采样阈值,则从所述候选训练数据中确定最新候选训练数据,并将所述最新候选训练数据输入所述初始网络,得到各个所述调度动作分别对应的多个所述训练评估值;利用所述训练评估值确定训练调度动作,并基于所述训练调度动作进行任务调度;对任务调度后的所述服务器网络进行状态检测,并利用得到的调度后状态信息、调度后通信信息和所述任务队列对应的调度后队列信息生成调度后环境信息;利用所述调度后环境信息得到所述训练调度动作对应的训练性能参数,并利用所述训练性能参数、所述调度后环境信息、所述训练调度动作和所述最新候选训练数据生成目标训练数据,并将所述目标训练数据确定为所述候选训练数据。可选地,所述利用所述调度后环境信息得到所述训练调度动作对应的训练性能参数,包括:利用所述训练调度动作涉及的各个待调度子任务的数据处理时长和数据传输时长得到任务处理时延;对所述训练调度动作涉及的各个待调度服务器进行剩余计算时长检测,得到剩余计算时长;将所述任务处理时延和所述剩余计算时长相加,得到各个所述待调度服务器对应的任务延迟;利用各个所述任务延迟得到平均延迟,并将所述平均延迟确定为所述训练性能参数。可选地,所述对所述任务需求进行拆分,得到多个具有约束关系的子任务,包括:对所述任务需求进行子任务检测,得到多个所述子任务;多各个所述子任务进行输入数据和输出数据检测,得到检测结果,并基于所述检测结果得到各个所述子任务之间的所述约束关系。本申请还提供了一种任务调度装置,包括:拆分模块,用于若获取到任务需求,则对所述任务需求进行拆分,得到多个具有约束关系的子任务;队列更新模块,用于对非候选子任务进行执行条件检测,将满足执行条件的所述非候选子任务确定为候选子任务,并将所述候选子任务放入任务队列;状态检测模块,用于对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;动作评估模块,用于将所述服务器状态信息、所述通信信息和所述任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;调度模块,用于利用所述评估值在多个所述调度动作中确定目标调度动作,并基于所述目标调度动作对所述任务队列中的所述候选子任务进行调度。本申请还提供了一种电子设备,包括存储器和处理器,其中:所述存储器,用于保存计算机程序;所述处理器,用于执行所述计算机程序,以实现上述的任务调度方法。本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的任务调度方法。本申请提供的任务调度方法,若获取到任务需求,则对任务需求进行拆分,得到多个具有约束关系的子任务;对非候选子任务进行执行条件检测,将满足执行条件的非候选子任务确定为候选子任务,并将候选子任务放入任务队列;对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;将服务器状态信息、通信信息和任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;利用评估值在多个调度动作中确定目标调度动作,并基于目标调度动作对任务队列中的候选子任务进行调度。可见,该方法并不将用户的任务需求看作一个整体,而是将其组成该任务需求的各个子任务拆分出来,对各个子任务进行调度,实现在一个决策阶段内对多个任务需求进行调度的效果,最大本文档来自技高网...

【技术保护点】
1.一种任务调度方法,其特征在于,包括:/n若获取到任务需求,则对所述任务需求进行拆分,得到多个具有约束关系的子任务;/n对非候选子任务进行执行条件检测,将满足执行条件的所述非候选子任务确定为候选子任务,并将所述候选子任务放入任务队列;/n对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;/n将所述服务器状态信息、所述通信信息和所述任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;/n利用所述评估值在多个所述调度动作中确定目标调度动作,并基于所述目标调度动作对所述任务队列中的所述候选子任务进行调度。/n

【技术特征摘要】
1.一种任务调度方法,其特征在于,包括:
若获取到任务需求,则对所述任务需求进行拆分,得到多个具有约束关系的子任务;
对非候选子任务进行执行条件检测,将满足执行条件的所述非候选子任务确定为候选子任务,并将所述候选子任务放入任务队列;
对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息;
将所述服务器状态信息、所述通信信息和所述任务队列对应的队列信息输入动作价值评估模型,得到多个调度动作分别对应的多个评估值;
利用所述评估值在多个所述调度动作中确定目标调度动作,并基于所述目标调度动作对所述任务队列中的所述候选子任务进行调度。


2.根据权利要求1所述的任务调度方法,其特征在于,所述对非候选子任务进行执行条件检测,包括:
判断所述非候选子任务是否为需求起始任务;
若是所述需求起始任务,则确定所述非候选子任务满足所述执行条件;
若不是所述需求起始任务,则判断所述非候选子任务的前序任务是否全部执行完毕;
若所述前序任务全部执行完毕,则确定所述非候选子任务满足所述执行条件;
若所述前序任务未全部执行完毕,则确定所述非候选子任务不满足所述执行条件。


3.根据权利要求1所述的任务调度方法,其特征在于,所述对边缘服务器构成的服务器网络进行状态检测,得到服务器状态信息和通信信息,包括:
对各个所述边缘服务器进行剩余计算时长检测,得到所述服务器状态信息;
对所述服务器网络中的各个网络信道进行剩余传输时长检测,得到所述通信信息。


4.根据权利要求1所述的任务调度方法,其特征在于,所述动作价值评估模型的训练过程,包括:
获取多个训练数据,并将所述训练数据分别输入初始网络,得到各个所述训练数据分别对应的多个训练评估值;
利用所述训练评估值确定目标训练调度动作,并根据所述目标训练调度动作进行任务调度,并得到各个所述训练数据对应的性能参数;
利用所述性能参数得到目标评估值,并利用所述训练评估值和所述目标评估值得到损失值;
利用所述损失值更新所述初始网络,迭代训练得到所述动作价值评估模型。


5.根据权利要求4所述的任务调度方法,其特征在于,所述获取多个训练数据,包括:
判断候选训练数据的数量是否达到采样阈值;
若达到所述采样阈值,则利用上一训练轮次对应的所述训练数据和所述性能参数生成新的所述候选训练数据,并从所述候选训练数据中随机选择所述采样阈值个所述训练数据;
若未达到所述采样阈值,则从所述候选训练数据中确定最新候选训练数据,并将所述最新候选训练数据输入所述初始网络,得到各个所述调度动作分别对应的多个所述...

【专利技术属性】
技术研发人员:张亚强李茹杨赵雅倩李仁刚
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1