本发明专利技术实施例提供了一种集群调度方法、装置和系统以及电子设备。该方法包括:获取集群中时效性实例的时效信息;根据所述时效性实例的时效信息,确定调度策略;根据所述调度策略,对所述集群中的计算实例进行任务分配。本发明专利技术实施例通过监控时效性实例的时效信息,来确定相应的调度策略,以对集群中的计算实例进行任务分配,从而发挥时效性计算资源的弹性优势,能够进一步优化集群调度、提高资源利用率。
Cluster scheduling methods, devices and systems and electronic equipment
【技术实现步骤摘要】
集群调度方法、装置和系统以及电子设备
本专利技术涉及云计算
,尤其涉及一种集群调度方法、装置和系统以及电子设备。
技术介绍
在云计算领域,为了提高云计算资源的利用率,云服务提供方提供一种竞价实例服务,即,在一定的时效范围内,用户可以以远低于普通实例的价格购买竞价实例,在超出时效后,竞价实例则可随时被释放掉。用户可以通过选择竞价实例服务,来有计划地使用海量弹性计算资源,以节约成本。在集群化云计算服务中,通过设置集群调度器来针对计算资源(各种实例)进行调度管理。现有的集群调度器,针对已知固定的计算资源进行调度管理,默认已加入集群的计算资源在非故障状况下均可获得。专利技术人在实现本专利技术的过程中,发现现有技术至少存在如下问题:现有的集群调度器在进行计算资源调度时,不考虑所调度的资源是否具有时效性,因此也无法感知实例的时效性,难以发挥时效性实例的弹性优势。
技术实现思路
本专利技术实施例提供一种集群调度方法、装置和系统以及电子设备,以解决现有技术中,难以发挥时效性实例的弹性优势的缺陷。为达到上述目的,本专利技术实施例提供了一种集群调度方法,包括:获取集群中时效性实例的时效信息;根据所述时效性实例的时效信息,确定调度策略;根据所述调度策略,对所述集群中的计算实例进行任务分配。本专利技术实施例还提供了一种集群调度装置,包括:信息获取模块,用于获取集群中时效性实例的时效信息;策略确定模块,用于根据所述时效性实例的时效信息,确定调度策略;执行模块,用于根据所述调度策略,对所述集群中的计算实例进行任务分配。本专利技术实施例还提供了一种集群调度系统,包括:集群资源管理组件和集群调度器,所述集群资源管理组件用于,获取集群中时效性实例的时效信息,将所述时效信息发送至所述集群调度器;所述集群调度器用于,接收所述集群资源管理组件发送的所述时效性实例的时效信息,根据所述时效性实例的时效信息,确定调度策略,并根据所述调度策略,对所述集群中的计算实例进行任务分配。本专利技术实施例还提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于运行所述存储器中存储的所述程序,以用于:获取集群中时效性实例的时效信息;根据所述时效性实例的时效信息,确定调度策略;根据所述调度策略,对所述集群中的计算实例进行任务分配。本专利技术实施例还提供了一种计算机可读存储介质,在所述计算机可读存储介质上存储有指令,所述指令包括:获取集群中时效性实例的时效信息;根据所述时效性实例的时效信息,确定调度策略;根据所述调度策略,对所述集群中的计算实例进行任务分配。本专利技术实施例提供的集群调度方法、装置和系统以及电子设备,通过监控时效性实例的时效信息,来确定相应的调度策略,以对集群中的计算实例进行任务分配,从而发挥时效性计算资源的弹性优势,能够进一步优化集群调度、提高资源利用率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术提供的集群调度系统实施例的系统框图;图2为本专利技术提供的集群调度系统实施例的时序图;图3为本专利技术提供的集群调度方法一个实施例的流程图;图4为本专利技术提供的集群调度方法另一个实施例的流程图;图5为本专利技术提供的集群调度装置一个实施例的结构示意图;图6为本专利技术提供的集群调度装置另一个实施例的结构示意图;图7为本专利技术提供的电子设备实施例的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。现有技术中,集群调度器针对已知固定的计算资源进行调度管理,默认已加入集群的计算资源在非故障状况下均可获得。也就是说,现有的集群调度器在进行计算资源调度时,不考虑所调度的资源是否为竞价实例,因此也无法感知竞价实例的时效性,难以发挥竞价实例的弹性优势。因此,针对现有技术的缺陷,本申请提出了一种集群调度方案,其主要原理是:获取时效性计算资源(即,时效性实例)的时效信息,并根据时效信息来确定调度策略,以对计算资源进行任务分配,从而发挥时效性计算资源的弹性优势,能够进一步优化集群调度、提高资源利用率。上述实施例是对本专利技术实施例的技术原理的说明,下面通过多个实施例来进一步对本专利技术实施例具体技术方案进行详细描述。实施例一图1为本专利技术提供的集群调度系统实施例的系统框图,图1所示的结构仅仅是本专利技术的技术方案可以应用的业务系统的示例之一。本专利技术实施例所提供的集群调度系统可应用于集群化云计算服务的场景中,例如,高性能计算(HighPerformanceComputing;以下简称HPC)集群上云等场景。HPC是一个有着较长时间发展历史的领域,在科学工程计算方面发挥着重要的作用。随着云计算和人工智能的崛起,HPC集群上云的需求越来越多,单个集群的规模也越来越大,在向云上迁移的过程中,利用云上资源的特色服务(如,竞价实例服务)构建最佳性价比的HPC集群成为一个重要的课题。如图1所示,本专利技术实施例提供的集群调度系统包括:集群资源管理组件11和集群调度器12。其中,集群资源管理组件11用于获取集群中时效性实例的时效信息,将该时效信息发送至集群调度器12;集群调度器12用于接收集群资源管理组件11发送的时效性实例的时效信息,根据时效性实例的时效信息,确定调度策略,并根据该调度策略,对集群中的各个计算实例进行任务分配。在本专利技术实施例中,集群资源管理组件11可以负责整个集群的资源创建、删除、计算资源的加入、退出等生命周期的管理。集群资源管理组件11与集群调度器12交互,通知集群调度器12计算资源(计算实例)的加入、退出,以便集群调度器12能够确定或更新调度策略。与传统超算系统的组成不同,由于云上的时效性实例是可以弹性的申请、释放的,因此集群资源管理组件11可专门用于集群资源的生命周期管理。当然,在本专利技术实施例中,集群资源管理组件11可以是独立部署的系统,也可以与集群调度器12一起部署,还可以作为集群调度器12的一个内部组件。集群调度器12可以负责接收用户提交的计算作业(计算任务),根据不同的调度策略,将任务分配到计算集群的具体计算资源(计算实例)上进行计算,并监控任务运行状态,以得到计算执行结果。不同本文档来自技高网...
【技术保护点】
1.一种集群调度方法,其特征在于,包括:/n获取集群中时效性实例的时效信息;/n根据所述时效性实例的时效信息,确定调度策略;/n根据所述调度策略,对所述集群中的计算实例进行任务分配。/n
【技术特征摘要】
1.一种集群调度方法,其特征在于,包括:
获取集群中时效性实例的时效信息;
根据所述时效性实例的时效信息,确定调度策略;
根据所述调度策略,对所述集群中的计算实例进行任务分配。
2.根据权利要求1所述的集群调度方法,其特征在于,所述时效性实例的时效信息中包含所述时效性实例的到期时刻,所述根据所述时效性实例的时效信息,确定调度策略,包括:
根据所述时效性实例的到期时刻,确定即将到期实例,所述即将到期实例为其到期时刻与当前时刻的时间差小于预设时间阈值的实例;
根据所述即将到期实例的实例信息,确定调度策略。
3.根据权利要求2所述的集群调度方法,其特征在于,所述调度策略包括:
当所述即将到期实例在当前时刻没有执行计算任务,或执行计算任务失败时,立即释放所述即将到期实例。
4.根据权利要求2所述的集群调度方法,其特征在于,所述调度策略包括:
当所述即将到期实例在当前时刻正在执行计算任务时,待执行完当前的计算任务时,释放所述即将到期实例。
5.根据权利要求2所述的集群调度方法,其特征在于,所述调度策略包括:
继续调度任务到所述即将到期实例,直至所述即将到期实例被系统释放。
6.根据权利要求2所述的集群调度方法,其特征在于,所述调度策略包括:
根据用户输入的策略选择指令,立即释放所述即将到期实例;或者,待执行完当前的计算任务时,释放所述即将到期实例;或者,继续调度任务到所述即将到期实例,直至所述即将到期实例被系统释放。
7.根据权利要求1至6中任一权利要求所述的集群调度方法,其特征在于,在所述获取集群中时效性实例的时效信息之前,还包括:
申请计算实例,创建集群,所述计算实例中包含时效性实例。
8.根据权利要求7所述的集群调度方法,其特征在于,还包括:
当所述集群中的时效性实例的个数低于预设数量阈值时,申请新的时效性实例。
9.一种集群调度装置,其特征在于,包括:
信息获取模块,用于获取集群中时效性实例的时效信息;
策略确定模块,用于根据所述时效性实例的时效信息,确定调度策略;
执行模块,用于根据所述调度策略,对所述集群中的计算实例进行任务分配。
10.根据权利要求9所述的集群调度装置,其特征在于,所述时效性实例的时效信息中...
【专利技术属性】
技术研发人员:贺荣徽,何万青,田永军,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。