A cloud resource scheduling method based on in-depth learning includes two stages: off-line training and online prediction. Off-line training stage: Sampling cloud host resource information and user history requirement information in cluster nodes; cleaning and standardizing the sampled data; building classifier model and scorer model, and making classifier data set and scorer data set; classifier model is used to pre-select cloud host resource that meets user's request, scorer model is used to select and use it. Cloud host resources with the highest matching degree of user requests; training classifier model and scorer model respectively; online prediction stage: establishing classifier scheduling data set and scorer scheduling data set; pre-selecting cloud host resources that meet user's current requests by input classifier scheduling data set into the training completed classifier model; and input scorer scheduling data set into training completed. The scorer model chooses the cloud host resources with the highest matching degree to user requests.
【技术实现步骤摘要】
一种基于深度学习的云资源调度方法
本专利技术涉及基于kubernetes云环境下合理调度计算节点资源并最大化使用资源,尤其是在主机资源无法预期评估的条件下,借助深度学习算法构建智能调度模型。
技术介绍
目前对于传统的云主机资源调度算法,对容器或者虚拟机的资源调度是整个平台稳定运行的关键,同时使得资源充分发挥最大能效,能否合理调度资源并对资源动态伸缩也是调度算法需要考虑的指标。云主机调度器是整个平台集群管理系统的核心,负责收集,分析集群管理系统中节点的资源使用情况,并以此为依据进行节点调度。调度策略主要分为两个阶段:预选和优选。其中预选阶段负责调度哪些节点可用,优选阶段则是筛选出最适合的节点。传统的调度方法属于静态资源调度,在用户服务调度的初期完成资源的分配,运行期间一般不做动态伸缩等,不能很好解决复杂的资源分配问题,具有一定的被动性,同时无法预知平台所需的预期节点资源。结合深度学习的新型算法不仅能够对节点资源进行调度,充分考虑整个云计算环境下资源使用情况,网络I/O等约束,借助人工智能手段,动态评估系统资源,实现智能调度,做到资源优化,动态伸缩,降低功耗等。
技术实现思路
为了解决上述传统方法对资源的静态调度,无法扩展等问题,本专利技术提出了一种基于深度学习的云主机智能调度方法,实现资源的动态伸缩和提前规划等。本方法将智能调度模型的训练过程分为两个阶段:分类器模型和打分器模型的训练。分为两个阶段训练的主要目的是在已经满足用户资源要求的基础之上进行优选,同时避免模型训练数据集维度过大导致的训练无法收敛或者收敛速度过慢。具体技术方案如下:1.数据采样:在集群节点中 ...
【技术保护点】
1.一种基于深度学习的云资源调度方法,其特征在于包括以下步骤:(1)数据采样:在集群节点中,采样云主机资源信息和用户历史需求信息,其中,云主机资源信息包含但不仅限于:剩余CPU核心数目,剩余内存大小,已使用端口号,以及剩余磁盘空间大小;用户历史需求信息包含但不仅限于:用户历史请求CPU核心数目,用户历史请求内存大小,用户历史请求的端口号,以及用户历史请求磁盘空间大小;(2)对采样数据进行清洗并进行规范化处理;(3)构建分类器模型以及打分器模型,并制作分类器数据集和打分器数据集;所述的分类器模型以及打分器模型均基于神经网络模型;所述的分类器模型用于预选符合用户请求的云主机资源,所述的打分器模型用于选择对用户请求的匹配度最高的云主机资源,其中分类器数据集包括云主机资源信息,用户历史需求信息,以及标签Label1,标签Label1用于表示云主机资源信息是否满足用户历史需求;打分器数据集包括经分类器模型预选之后的满足用户历史请求的云主机资源信息中CPU和内存两个字段,用户历史需求信息中CPU和内存两个字段,以及标签Label2,标签Label2用于代表云主机资源对用户请求信息的匹配度;(4)分 ...
【技术特征摘要】
1.一种基于深度学习的云资源调度方法,其特征在于包括以下步骤:(1)数据采样:在集群节点中,采样云主机资源信息和用户历史需求信息,其中,云主机资源信息包含但不仅限于:剩余CPU核心数目,剩余内存大小,已使用端口号,以及剩余磁盘空间大小;用户历史需求信息包含但不仅限于:用户历史请求CPU核心数目,用户历史请求内存大小,用户历史请求的端口号,以及用户历史请求磁盘空间大小;(2)对采样数据进行清洗并进行规范化处理;(3)构建分类器模型以及打分器模型,并制作分类器数据集和打分器数据集;所述的分类器模型以及打分器模型均基于神经网络模型;所述的分类器模型用于预选符合用户请求的云主机资源,所述的打分器模型用于选择对用户请求的匹配度最高的云主机资源,其中分类器数据集包括云主机资源信息,用户历史需求信息,以及标签Label1,标签Label1用于表示云主机资源信息是否满足用户历史需求;打分器数据集包括经分类器模型预选之后的满足用户历史请求的云主机资源信息中CPU和内存两个字段,用户历史需求信息中CPU和内存两个字段,以及标签Label2,标签Label2用于代表云主机资源对用户请求信息的匹配度;(4)分别训练分类器模型和打分器模型,将分类器数据集分为分类器训练集和分类器验证集,首先通过分类器训练集对分类器模型进行训练,然后用分类器验证集对训练后的分类器模型进行验证,如果分类器模型的预选结果正确率大于阈值A时,分类器模型完成训练,否则,分类器模型继续训练,直到分类器模型的预选结果正确率大于设定阈值A;打分器模型的训练方法与分类器模型训练方法一样,区别仅在于采用打分器数据集,所述的打分器数据集分为打分器训练集和打分器验证集;(5)完成对当前用户需求信息进行云资源调度,具体包括:5.1)建立分类器调度数据集和打分器调度数据集,其中分类器调度数据集包括云主机资源信息、用户当前需求信息,以及用于表示云主机资源信息是否满足用户当前需求的标签构成;打分器调度数据...
【专利技术属性】
技术研发人员:朱小亮,鄂新华,马肖攀,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。