【技术实现步骤摘要】
一种教育云平台中的大数据任务调度方法
本专利技术涉及云计算与大数据
,具体涉及一种教育云平台中的大数据任务调度方法。
技术介绍
云计算环境下,物理机中所有虚拟机对于物理资源的使用总量一般都少于物理资源的总量。为了提高物理资源的利用率,在构建虚拟资源池(包括计算、存储、网络等资源)时,资源通常会超配(物理机中所有虚拟机的vCPU或/和内存资源总量超过了物理机本身的资源限制)。随着云计算的快速发展,很多高校、培训机构及企事业单位的培训部门(统称培训单位)都建立了教育云平台,以对不同的实验课程提供支持。为支持受培训者进行大数据教学实验,云平台需要为每个受培训者配置独立的大数据集群(虚拟机集群)来进行大数据分析实验。较低配置(如8G内存、8vCPU、20G硬盘)的大数据集群(虚拟机集群)计算能力有限,只能用于在小数据集上进行实验;而较高配置(如640G内存、128vCPU、8T硬盘)的大数据集群(虚拟机集群)需要较多的物理机资源。为了能够给每个受培训者提供较高配置的大数据集群,突破培训单位的物理机资源有限的问题,培训单位需要使用较高的资源超配比来构建虚拟资源池支持实验。在大数据分析实验课程中,受培训者大部分时间都在编程、查资料、写文档等,虚拟机在这段时间使用物理资源量低;受培训者只在少数时间提交并运行大数据任务。大数据任务运行时,虚拟机集群对于物理资源的使用量很高。考虑到受培训者的实验进度差不多,过多需要运行较长时间的大数据任务可能在差不多时间提交并运行,造成在物理资源超配较高的情况下,过多的大数据任务并发运行在不同的大数据集群(虚拟机集群)中,导致物理机集 ...
【技术保护点】
1.一种教育云平台中的大数据任务调度方法,其特征在于,大数据任务调度方法运行在基于云计算技术的教育云平台,根据云平台的总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度;所述任务调度步骤包括:1)受培训者提交任务;2)系统自动拦截任务请求,并判断任务是否为大数据任务;若不是大数据任务,系统直接调度任务;否则,进入下一步骤;3)判断任务是否为教师建议的核心任务,若是核心任务,则预测核心任务需要的系统资源及运行时间;否则,将任务的运行优先级设为最低;4)根据任务代码、数据源、任务名称、任务运行参数,在数据库中添加相应的任务实例;5)根据调度方法将任务添加到任务队列中;6)根据调度方法从任务队列中获取运行优先级最高的任务;7)当云平台的资源满足任务的资源需求时,进入下一步骤;否则,将任务重新添加到任务队列中;8)按任务的资源需求分配资源后,如果用户当前使用的资源没有超过用户最大可用资源时,将任务分发到相应受培训者的大数据集群中;否则,将任务重新添加到任务队列中。
【技术特征摘要】
1.一种教育云平台中的大数据任务调度方法,其特征在于,大数据任务调度方法运行在基于云计算技术的教育云平台,根据云平台的总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度;所述任务调度步骤包括:1)受培训者提交任务;2)系统自动拦截任务请求,并判断任务是否为大数据任务;若不是大数据任务,系统直接调度任务;否则,进入下一步骤;3)判断任务是否为教师建议的核心任务,若是核心任务,则预测核心任务需要的系统资源及运行时间;否则,将任务的运行优先级设为最低;4)根据任务代码、数据源、任务名称、任务运行参数,在数据库中添加相应的任务实例;5)根据调度方法将任务添加到任务队列中;6)根据调度方法从任务队列中获取运行优先级最高的任务;7)当云平台的资源满足任务的资源需求时,进入下一步骤;否则,将任务重新添加到任务队列中;8)按任务的资源需求分配资源后,如果用户当前使用的资源没有超过用户最大可用资源时,将任务分发到相应受培训者的大数据集群中;否则,将任务重新添加到任务队列中。2.根据权利要求1所述的大数据任务调度方法,其特征在于,对于每个实验,受培训者通过系统设定以下任一种调度方法,以完成调度任务过程:a)先到先服务调度算法:在满足任务资源需求的情况下,先提交的任务先运行;b)高优先级优先调度算法:在满足任务资源需求的情况下,优先级高的任务先运行;c)最快完成优先调度算法:在满足任务资源需求的情况下,根据任务预测运行时间,能够最快完成的任务优先运行;d)最低资源需求得分优先调度算法;e)资源需求得分与运行时间积最小优先调度算法:在各分项资源均满足的任务中,选取任务资源需求得分与运行时间积最小的任务先运行;如果系统没有设定调度算法,缺省调度算法为e)。3.根据权利要求2所述的大数据任务调度方法,其特征在于,最低资源需求得分优先调度算法d)中,任务j的资源需求得分为:Sj=k1Cj+k2Mj+k3Ij+k4Dj其中Cj表示任务j需要的计算能力;Mj表示任务j需要的内存;Ij表示任务j需要的中间结果存储空间;Dj表示任务j需要的磁盘空间;k1、k2、k3、k4的取值保证k1Cj、k2Mj、k3Ij、k4Dj的值均在0-1之间;在各分项资源均满足的任务中,选取得分最少的任务先运行。4.根据权利要求1所述的大数据任务调度方法,其特征在于,所述核心任务需要...
【专利技术属性】
技术研发人员:温木奇,谢明森,黄国燕,万海,
申请(专利权)人:中山大学,广州云晫信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。