The invention relates to a method and system for processing cluster resources, resource processing cluster, including computing resource information monitoring node according to the node computing resources information cluster current idle computing resources; receiving carry resource allocation information operation request, the resource allocation information includes node labels; according to the corresponding node queue for the node according to the current label, idle nodes and the resource allocation information in the node in the queue for the computing resources assignment target computing resources; computing node resources corresponding to the start user mode Linux UML resource isolation in the target vessel, perform operations in the user space, can improve the cluster utilization, improve cluster job throughput.
【技术实现步骤摘要】
集群资源处理方法和系统、资源处理集群
本专利技术涉及计算机
,特别是涉及一种集群资源处理方法和系统、资源处理集群。
技术介绍
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。集群中的服务器协同工作,向用户提供网络应用服务,对于用户来说集群就像是一个单一系统。如企业采购或租用专用的计算机,使用linux类操作系统,为用户群提供访问服务。传统的集群资源处理方法,对容器资源进行管理时,往往需要更新内核或申请操作系统的管理员权限,更新内核会影响企业现有部署的服务,或者需要向运维人员申请管理员权限,不利于添加服务器节点进行相关部署,导致集群服务器不能灵活部署,且平均利用率不高。
技术实现思路
基于此,有必要针对上述技术问题,提供一种集群资源处理方法和系统、资源处理集群,提高集群利用率,提高集群内作业的吞吐量。一种集群资源处理方法,所述方法包括:监控节点计算资源信息,根据所述节点计算资源信息得到集群当前空闲计算资源;接收携带资源配置信息的作业请求,所述资源配置信息包括节点标签;根据所述节点标签获取对应的节点队列,根据所述资源配置信息在所述节点队列中的节点的当前空闲计算资源中为所述作业分配目标计算资源;在所述目标计算资源对应的节点启动用户模式LinuxUML资源隔离容器,在用户空间执行作业。一种集群资源处理系统,所述系统包括:计算资源监控管理模块,用于监控节点计算资源信息,根据所述节点计算资源信息得到集群当前空闲计算资源;计算资源分配模块,用于接收携带资源配置信息的作业请求,所述资源配置信息包括节点标签,根据所述节点标签获 ...
【技术保护点】
一种集群资源处理方法,所述方法包括:监控节点计算资源信息,根据所述节点计算资源信息得到集群当前空闲计算资源;接收携带资源配置信息的作业请求,所述资源配置信息包括节点标签;根据所述节点标签获取对应的节点队列,根据所述资源配置信息在所述节点队列中的节点的当前空闲计算资源中为所述作业分配目标计算资源;在所述目标计算资源对应的节点启动用户模式Linux UML资源隔离容器,在用户空间执行作业。
【技术特征摘要】
1.一种集群资源处理方法,所述方法包括:监控节点计算资源信息,根据所述节点计算资源信息得到集群当前空闲计算资源;接收携带资源配置信息的作业请求,所述资源配置信息包括节点标签;根据所述节点标签获取对应的节点队列,根据所述资源配置信息在所述节点队列中的节点的当前空闲计算资源中为所述作业分配目标计算资源;在所述目标计算资源对应的节点启动用户模式LinuxUML资源隔离容器,在用户空间执行作业。2.根据权利要求1所述的方法,其特征在于,所述在用户空间执行作业的步骤之后,还包括:如果外部负载增长占用的资源超过第一预设阈值或作业子任务占用的资源超过第二预设阈值,则清理所述UML资源隔离容器并转移作业子任务至所述节点队列中的其它节点。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取关键服务节点,判断当前时间是否在预设时间段,如果是,则设置所述关键服务节点的当前空闲计算资源为0,如果当前时间不在预设时间段,则所述关键服务节点的当前空闲计算资源为实际监控得到的节点计算资源。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:如果第一节点的当前空闲计算资源小于资源预设阈值,则将所述第一节点暂时脱离集群。5.根据权利要求1所述的方法,其特征在于,所述接收携带资源配置信息的作业请求的步骤之前,还包括:根据节点的物理属性信息与负载状态信息,为节点设置标签。6.根据权利要求1所述的方法,其特征在于,所述当前空闲计算资源是剩余磁盘空间大于磁盘空间预设阈值的节点的可用cpu核数、可用内存的总和。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:为负载状态满足稳定节点条件的节点设置静态static标签,在所述static标签的节点启动作业管理器,所述static标签的节点为专有节点,保持集群状态。8.根据权利要求1所述的方法,其特征在于,所述在所述目标计算资源对应的节点启动用户模式LinuxUML资源隔离容器的步骤包括:在执行脚本设置所述作业依赖的环境变量,并将作业需要的文件资源挂载至容器中,以普通用户身份创建启动UML资源隔离容器。9.根据权利要求1所述的方法,其特征在于,所述在所述目标计算资源对应的节点启动用户模式LinuxUML资源隔离容器的步骤包括:新建文件目录,如果新建成功,则获取锁,启动第一用户模式LinuxUML资源隔离容器,为所述第一UML资源隔离容器分配IP地址;所述第一UML资源隔离容器启动成功,则删除所述文件目录,释放锁。10.根据权利要求1所述的方法,其特征在于,所述方法还包括:在用户空间执行作业时,通过采用用户模式网络slirp网络模拟器以普通用户身份启动虚拟网络设备与物理网卡桥接,实现网络通信。11.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述作业对应的节点黑名单,如果所述节点黑名单中第一标签对应的节点个数与集群中第一标签对应的所有节点个数的比例超过标签阈值,则将所述节点黑名单中第一标签对应的节点移除所述节点黑名单。12.根据权利要求1所述的方法,其特征在于,所述在用户空间执行作业的步骤之后,还包括:所述作业执行结束,释放所述作业执行时占用的计算资源。13.一种集群资源处理系统,其特征在于,所述系统包括:计算资源监控管理模块,用于监控节点计算资源信息,根据所述节点计算资源信息得到集群当前空闲计算资源;计算资源分配模块,用于接收携带资源配置信息的作业请求,所述资源配置信息包括节点标签,根据所述节点标签获取对应的节点队列,根据所述资源配置信息在所述节点队列中的节点的当前空闲计算资源中为所述作业分配目标计算资源;作业执行模块,用于在所述目标计算资源对应的节点启动用户模式LinuxUML资源隔离容器,在用户空间执行作业。14.根据权利要求13所述的系统,其特征在于,所述系统还包括:第一资源限制模块,用于如果外部负载增长占用的资源...
【专利技术属性】
技术研发人员:唐祥豪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。