【技术实现步骤摘要】
基于服务发现和容器技术的大数据平台弹性伸缩方法
本专利技术涉及云计算大数据弹性伸缩领域,特别涉及一种基于服务发现和容器技术的大数据平台弹性伸缩方法。
技术介绍
在云计算相关领域,弹性伸缩有助于数据中心保持资源管理的鲁棒性,能够降低能耗缓解系统资源浪费。目前不管是流量巨大的电商、游戏等娱乐行业,还是请求量波动极大的视频、直播等新媒体行业,都需要在“资源不足”和“资源浪费”之间做权衡。邓子凡针对水平伸缩和垂直伸缩各自的缺点,提出一种将水平伸缩和垂直伸缩两种方式相结合的弹性伸缩模式,但依然存在虚拟机技术带来的缺点。在Gandhi等人的研究中指出了传统的解决方案的缺陷:AlwaysOn采用全冗余的方式会造成严重的资源浪费;Reactive采用延迟启动策略,但在虚拟机或应用环境启动时setup延迟时间太长,一般都会超过200秒;Predictive尝试利用线性回归等策略来拟合负载模型,提前启动虚拟机来缩短setup时间;弹性伸缩方法根据请求量动态调整资源配给,但由于虚拟机的启动延迟等缺陷,而采用了与Predictive结合的方式。随着容器技术的发展,弹性伸缩方法得到了更广泛的利用。例如在YWChen等人的研究中利用容器的弹性伸缩加速异构环境中的大数据作业,但在其解决方案中需要扩展大数据平台的相关模块,缺乏通用性。ToffettiG等人利用容器的弹性伸缩提出了一种能够自我管理的微服务架构,在其实现中采用etcd作为状态持久化中心,可以实时响应到集群状态的节点故障,从而实现自我恢复。HEYu等人提出了一种基于容器的高性能计算集群弹性伸缩架构,但其实现中用单节点维护服务状 ...
【技术保护点】
一种基于服务发现和容器技术的大数据平台弹性伸缩方法,其特征在于,包括以下步骤:第一步骤:使用容器技术对各大数据平台进行组件化封装处理;第二步骤:初始化大数据集群管理的元数据目录,在大数据集群启动时,拉取并启动相应大数据平台组件,并将集群元数据信息注册到服务代理;第三步骤:每个主机集群节点的状态监控器周期向服务代理汇报心跳数据,并更新相关信息,实现对集群内部的状态感知;第四步骤:主机集群的代理服务周期向服务代理读取大数据集群管理信息,判断是否存在节点失效或需求变更情况,若在心跳周期内服务代理未接收到容器节点的状态数据则将该节点视为节点失效,此时服务代理从元数据中将该节点运行状态标记为失效,反之节点运行状态标记为有效,如果存在节点失效或需求变更情况,则执行第五步骤;否则,执行第六步骤;第五步骤:若存在节点失效情况,则尝试恢复失效的节点容器;若存在需求变更情况,则根据需求变更元数据,相应代理服务为集群添加或删除节点容器;第六步骤:重复执行以上第三至第五步骤,直至集群服务终止运行。
【技术特征摘要】
1.一种基于服务发现和容器技术的大数据平台弹性伸缩方法,其特征在于,包括以下步骤:第一步骤:使用容器技术对各大数据平台进行组件化封装处理;第二步骤:初始化大数据集群管理的元数据目录,在大数据集群启动时,拉取并启动相应大数据平台组件,并将集群元数据信息注册到服务代理;第三步骤:每个主机集群节点的状态监控器周期向服务代理汇报心跳数据,并更新相关信息,实现对集群内部的状态感知;第四步骤:主机集群的代理服务周期向服务代理读取大数据集群管理信息,判断是否存在节点失效或需求变更情况,若在心跳周期内服务代理未接收到容器节点的状态数据则将该节点视为节点失效,此时服务代理从元数据中将该节点运行状态标记为失效,反之节点运行状态标记为有效,如果存在节点失效或需求变更情况,则执行第五步骤;否则,执行第六步骤;第五步骤:若存在节点失效情况,则尝试恢复失效的节点容器;若存在需求变更情况,则根据需求变更元数据,相应代理服务为集群添加或删除节点容器;第六步骤:重复执行以上第三至第五步骤,直至集群服务终止运行。2.根据权利要求1所述的基于服务发现和容器技术的大数据平台弹性伸缩方法,其特征在于,在第一步骤中,所述对各大数据平台的进行组件化封装处理,具体使用Docker容器虚拟化技术对大数据平台进行镜像化封装处理,形成大数据组件库,包括Hadoop镜像、Spark镜像、Kafka镜像、以及Storm镜像。3.根据权利要求1所述的基于服务发现和容器技术的大数据平台弹性伸缩方法,其特征在于,在第二步骤中,所述元数据目录,具体包括根目录为每个注册的大数据集群单独维护的一个128位GUID、作为每个独立大数据集群个体的标识、子目录存储集群各节点的相关信息、以及集群需求变更元数据信息,其中,所述集群需求变更元数据信息,无变更以0标识,增加节点以“1”+主机ip字符串标识,删除节点以“2”+主机ip字符串标识;所述子目录存储集群各节点的相关信息,具体包括所属集群ID、自身IP地址、节点运行状态、CPU使用率、内存使用率、以及IO负载情况,并使用JSON格式进行存储,所述节点运行状态,有效以0标记,失效以1标记。4.根据权利要求1所述的基于服务发现和容器技术的大数据平台弹性伸缩方法,其特征在于,在第三步骤中,所述每个主机集群节点的状态监控器周期向服务代理汇报心跳数据,并更新相关信息的方法为:状态监控器获取当...
【专利技术属性】
技术研发人员:林伟伟,吴梓明,张子龙,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。