在数量动态更新中同时维护计算节点制造技术

技术编号:27440375 阅读:23 留言:0更新日期:2021-02-25 03:45
公开了一种用于维护包括多个计算节点的计算系统的方法。该方法包括:在不超过限制数量的计算节点的维护子集上同时引起维护活动的应用;在维护活动的应用期间监测计算系统的一个或多个状态指示符;以及根据状态指示符更新限制数量。还公开了用于执行该方法的计算机程序和计算机程序产品。此外,公开了一种相应的控制计算机。的控制计算机。的控制计算机。

【技术实现步骤摘要】
【国外来华专利技术】在数量动态更新中同时维护计算节点

技术介绍

[0001]本公开涉及信息
更具体地,本公开涉及计算系统的维护。
[0002]以下通过讨论与其上下文相关的技术来介绍本公开的背景。然而,即使当本讨论涉及文档、动作、人工制品等时,也不建议或表示所讨论的技术是现有技术的一部分或是与本公开相关的领域中的公知常识。
[0003]每个计算系统通常随时间推移而经受维护活动;例如,维护活动例行地应用于在计算系统上运行的软件程序,如安装用于纠正错误的补丁、升级软件程序以改进其操作或添加新功能。
[0004]维护活动的应用可能不利地影响计算系统的操作。实际上,软件程序在其上的维护活动的应用期间(或至少在其部分期间)不可用。在任何情况下,维护活动减慢计算系统(以及然后在其上运行的任何其他软件程序)的操作。此外,维护活动可能需要使计算系统离线(例如,当需要重新引导计算系统以使维护活动有效时)。
[0005]特定场景是当计算系统包括对其操作有贡献的多个计算节点时(充当响应于从外部向其提交的对应请求而提供服务的单个逻辑实体)。例如,可以在集群架构中组织计算节点,其中计算系统自动地将请求分配给最适合于其处理的计算节点(全部执行相同的任务)。这提供了计算系统的并行处理和/或高可用性。典型的示例是当计算系统是云类型时。在这种情况下,云服务由云提供商提供给相应的用户,云提供商在请求时提供、配置和释放相应的计算资源(具有对用户完全不透明的其实际实现)。云服务从其实现的这种解耦合提供了对应计算资源的无限容量的错觉并且改进了它们的利用,尤其是对于高峰值负载条件(借助于规模经济);此外,用户现在依赖于计算资源的管理,并且它们可以执行先前由于其成本和复杂性(尤其是对于个人和小公司)而不可行的任务(基于每次使用付费)。
[0006]在上述基于计算节点的计算系统中,每个维护活动可同时连续地应用于计算节点的子集。以此方式,计算系统在维护活动期间保持在线(其中向其提交的请求由保持可用的计算节点处理)。
[0007]然而,可用计算节点的数量减少可能导致计算系统的性能下降;在最坏的情况下,计算系统的性能可能太低以至于它从外部看起来完全无法获得。这在若干情况下可能是不可接受的。典型的示例是当由云类型的计算系统提供的云服务需要预定义的服务级别时;可以根据云服务要满足的一个或多个目标度量(诸如最大响应时间),在每个用户和相应的云提供者之间协商的服务水平协议(SLA)中定义服务水平。
[0008]此外,将维护活动渐进地应用到计算节点增加了将其应用到整个计算系统所需的时间。这增加了计算系统(即,安装在其计算节点上的相同软件程序的不同实例)不是始终最新的时间。

技术实现思路

[0009]在此呈现本公开的简化的
技术实现思路
以便提供其基本理解;然而,本
技术实现思路
过的唯一目的是以简化的形式介绍本公开的一些概念作为其以下更详细描述的序言,并且其不
应被解释为其关键元素的标识也不应被解释为其范围的描绘。
[0010]一般而言,本公开是基于以动态方式同时更新要维护的多个计算节点的数量的想法。
[0011]具体地,一个方面提供了一种用于维护包括多个计算节点的计算系统的方法。该方法包括:在不超过限制数量的计算节点的维护子集上同时引起维护活动的应用;在应用维护活动期间监测计算系统的一个或多个状态指示符;以及根据状态指示符更新限制数量。
[0012]又一方面提供一种用于实施该方法的计算机程序。
[0013]另一方面提供一种用于实施该方法的计算机程序产品。
[0014]另一方面提供一种相应的系统。
[0015]另一方面提供了相应的控制计算机。
[0016]更确切地,在独立权利要求中阐述了本公开的一个或多个方面并且在从属权利要求中阐述了其有利特征,在此通过引用逐字并入的所有权利要求的措辞(具有参照任何特定方面提供的任何有利特征,该任何特定方面比照适用于每个其他方面)。
附图说明
[0017]参考以下仅以非限制性指示的方式给出的其详细说明,结合附图阅读,本公开的解决方案以及其进一步的特征和优点被将最好地理解(其中,为了简单起见,对应的元件用相同或相似的附图标记表示,并且不重复它们的解释,并且每个实体的名称通常用于表示其类型和其属性,如值、内容和表示)。具体地:
[0018]图1示出了根据本公开的实施例的可以实践的计算基础设施的示意性框图。
[0019]图2A-图2D示出了根据本公开的实施例的一般原理。
[0020]图3A至图3B示出了根据本公开的实施例的应用实例。
[0021]图4示出了根据本公开的实施例的可使用的主要软件组件。
[0022]图5A至图5B示出了根据本公开的实施例的活动图,该活动图描述了与实现方式相关的活动流程。
具体实施方式
[0023]本专利技术的一些实施例可以表示技术改进的一种方式是它以实时改变概述虚拟环境状态的参数的认知方式提供云基础结构的监测和提供补救动作。本公开的一些实施例可以表示计算机能力的特定改进,而不是计算机仅作为工具被调用的想法,因为系统作为人工智能主动地且持续地学习,以便安全地更新每个参数以确保最佳操作。
[0024]具体参见图1,示出了根据本公开的说明性实施例的可以被实践的计算基础设施100的示意性框图。
[0025]计算基础架构100包括一个或多个云提供者105(图中仅示出一个)。每个云提供者105是提供计算资源池作为云服务(即,可以非常快速地供应、配置和释放的共享计算资源)的实体;云服务的计算资源(一般为虚拟类型,即,通过物理计算资源的软件仿真)在请求时提供给云提供者105的用户,使得每个用户具有对这些计算资源的唯一控制(其然后可被准确地使用,好像它们是专用物理计算资源一样)。云服务可以根据若干服务模型来提供,具
体地,基础设施即服务,或IaaS(提供具有对应存储和管理软件的计算资源,如虚拟机、具有防火墙的虚拟磁盘、负载平衡器),平台即服务或PaaS(提供软件平台,诸如数据库、web服务器)、软件即服务,或SaaS(提供软件应用程序,如CAD、办公套件)和网络即服务,或NaaS(提供连通性服务,诸如VPN、IP地址)。此外,云服务可以根据不同的部署模型来提供,具体地,公共云(即,用于一般公众)、私有云(即,用于单个组织)、共同体云(即,用于若干组织)或混合云(基于不同部署模型的组合)。
[0026]用户经由(通信)网络115与相应的客户端计算机或简单地客户端110(例如,瘦类型的)连接至云提供者105;例如,网络115可以是用于公共/共同体云的互联网或者用于私有云的LAN。为此目的,云提供者105暴露用于访问它的前端组件(例如,经由客户端110的web浏览器);前端组件与实际实现云服务的后端组件对接(后端组件不能从外部访问,使得用户完全不知道其位置和配置)。
[0027]云服务由计算节点120的群集(或多个)提供,例如虚拟机(充当具有执行相同任务的所有计算节点120的单个逻辑实体)。在根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在控制计算机器的控制下维护计算系统的方法,所述计算系统包括有助于所述计算系统的操作的多个计算节点,其中所述方法包括:由所述控制计算机器通过以下操作初始化限制数量的计算节点:由所述控制计算机器在不超过所述限制数量的所述计算节点的维护子集上同时引起维护活动的应用,由所述控制计算机器在所述维护活动的所述应用期间监测一个或多个状态指示符,所述状态指示符指示所述计算系统的状态,以及由所述控制计算机器根据在所述维护活动的所述应用期间正被监测的所述状态指示符的监测值来更新所述限制数量,重复所述引起、监测和更新的步骤,直到所述维护活动已应用于所有所述多个计算节点。2.如权利要求1所述的方法,其中,所述监测包括:由所述控制计算机器监测所述状态指示符,所述状态指示符包括指示所述计算节点的状态的一个或多个节点状态指示符。3.如权利要求1所述的方法,其中,所述监测包括:由所述控制计算机器监测所述状态指示符,所述状态指示符包括指示在所述计算节点上运行的一个或多个软件程序的状态的一个或多个程序状态指示符。4.如权利要求1所述的方法,其中,所述监测包括:由所述控制计算机器监测所述状态指示符,所述状态指示符包括指示所述计算系统的一个或多个系统基础设施的状态的一个或多个基础设施状态指示符。5.如权利要求1所述的方法,其中,所述监测包括:由所述控制计算机器监测包括所述计算系统的关键状况的一个或多个指示的所述状态指示符。6.如权利要求1所述的方法,其中,所述更新包括:在不应用所述维护活动的情况下,由所述控制计算机器根据由所述监测值定义的监测点与在参考条件下所述计算系统的状态的参考表示的比较来更新所述限制数量。7.如权利要求6所述的方法,其中,所述方法包括:由所述控制计算机器测量所述参考条件下的所述状态指示符,以及由所述控制计算机器根据在所述参考条件下测量的所述状态指示符的测量值来定义所述参考表示。8.如权利要求6所述的方法,其中,所述更新包括:由所述控制计算机器根据所述监测点与由所述参考表示的相应参考值定义的参考点的比较来更新所述限制数量。9.如权利要求6所述的方法,其中,所述更新包括:由所述控制计算机器根据所述监测点距所述参考表示的距离来更新所述限制数量。10.如权利要求6所述的方法,其中,所述更新包括:由所述控制计算机器根据所述监测点随时间的梯度来更新所述限制数量。11.如权利要求1所述的方法,其中,响应于所述限制数量的减少,所述方法包括:由所述控制计算机器等待在所述计算节点中的一个或多个上的所述维护活动的所述
应用的完成,和/或由所述控制计算机器在所述计算节点中的一个或多个上回退所述维护活...

【专利技术属性】
技术研发人员:A
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1