用于分布式虚拟化基础设施元件监视和策略控制的多集群面板制造技术

技术编号:39253112 阅读:12 留言:0更新日期:2023-10-30 12:04
本公开的实施例涉及用于分布式虚拟化基础设施元件监视和策略控制的多集群面板。计算系统包括多个不同的基于云的计算集群(例如,不同的云项目),每个基于云的计算集群包括计算节点集合。策略代理在计算节点上执行,以监视与计算节点资源有关的性能和使用度量。每一个集群内的策略控制器将策略部署到策略代理,并通过针对计算集群的基础设施元件的一个或多个规则集合的应用来评估来自策略代理的性能和使用度量。策略控制器中的每一个基于对集群的性能和使用度量的评估来将指示基础设施元件的当前健康状况的数据输出到多集群面板软件系统。多集群面板软件系统数据作为单个用户界面屏幕输出基于云的计算集群中的每一个的当前健康状况。的当前健康状况。的当前健康状况。

【技术实现步骤摘要】
用于分布式虚拟化基础设施元件监视和策略控制的多集群面板
[0001]相关申请
[0002]本申请是申请号为201810267159.8、申请日为2018年3月28日、专利技术名称为“用于分布式虚拟化基础设施元件监视和策略控制的多集群面板”的专利技术专利申请的分案申请。
[0003]本申请要求2017年12月19日提交的美国申请第15/846,400号的权益,其要求于2017年3月29日提交的美国临时申请第62/478,515号、于2017年4月19日提交的美国临时申请第62/487,254号、以及于2017年4月19日提交的美国临时申请第62/487,244号的优先权。这些申请中的每一个的全部内容通过引用并入本文。


[0004]本公开涉及监视和改进云数据中心和网络的性能。

技术介绍

[0005]虚拟化数据中心正在成为现代信息技术(IT)基础设施的核心基础。具体地,现代数据中心已广泛利用虚拟化环境,在其中诸如虚拟机或容器的虚拟主机在物理计算设备的底层计算平台上被部署和执行。
[0006]具有大规模数据中心的虚拟化可提供几个优点。一个优点是虚拟化可以显著提高效率。由于随着每个物理CPU具有大量内核的多核微处理器架构的出现,底层物理计算设备(即服务器)变得越来越强大,虚拟化变得更容易和更高效。第二个优点是虚拟化可以对基础设施提供重要控制。随着物理计算资源诸如在基于云的计算环境中成为可替代资源,计算基础设施的供应和管理变得更加容易。因此,除了虚拟化提供的效率和增加的投资回报率(ROI)之外,企业IT工作人员通常更喜欢数据中心中的虚拟化计算集群用于它们的管理优点。

技术实现思路

[0007]本公开描述了用于诸如在数据中心内部署的虚拟化基础设施的计算环境的监视、调度和性能管理的技术。这些技术提供操作性能和基础设施资源的可视性。如本文所述,这些技术可以利用分布式架构中的分析来提供实时和历史监视、性能可视性和动态优化,以改进计算环境内的组织、安全性、计费和计划。这些技术可以在例如混合、私人或公共企业云环境内提供优点。这些技术兼容诸如容器和虚拟机的各种虚拟化机制,以支持多租户、动态和持续演进的企业云。
[0008]本公开的方面涉及监视作为基础设施的更高级别组件的多个不同元件之间共享的可消耗资源的性能和使用,所述资源被分别使用与组相关联的一个或多个规则集合来至少部分地针对作为一个或多个元件组的成员的这些元件来评估。例如,用户可以为元件配置规则集合,并进一步将元件配置为一个或多个元件组的成员,每个组具有对应的规则集合。策略控制器可以向在计算设备(例如服务器或网络设备)上执行的策略代理分发该元件
的简档,其是该元件和该元件是其成员的每个组的规则集合的集合。策略代理可以基于多个规则集合以及由策略代理接收的度量来评估简档,该度量指示资源以及至少在一些情况下也是组的成员的一个或多个其他元件的性能。在某些情况下,策略代理可以将度量报告给更高级别的策略控制器,以使策略控制器能够使用分布在多个计算设备之间的资源的度量来评估简档。
[0009]在评估元件的简档时,策略代理可以向策略控制器报告简档状态和/或诸如通过行为来限制简档应用于的元件所消耗的资源的使用来采取改善动作。在其他示例中,策略控制器可以监督响应于来自策略控制器的指示来可动作以限制共享资源的使用的多个服务器。
[0010]此外,在一些示例中,关于一个或多个元件如何使用共享资源的信息可以被分析。基于这些信息,元件可以基于共享资源使用特征而被分类。这些分类可用于更高效地跨多个物理服务器设备分配元件。
[0011]这些技术可以提供一个或多个优点。例如,这些技术可以允许用户为不同类型的元件组配置不同的规则集合,其中多个组与元件成员资格重叠,并且每个组具有对应的规则集合。这种灵活的组成员资格和规则集合配置可以允许用户通过配置另一组中的元件或组的成员资格而不必手动配置元件或组的整体简档,用简档来表达要应用于元件或组的警报的组合。此外,这些技术可以通过使用作为组成员的新元件集合来评估组简档来动态地考虑组成员资格中的改变,而不必重新配置组简档。
[0012]在一个示例中,一种方法包括由策略控制器获得虚拟化基础设施的元件的第一简档,第一简档包括具有一个或多个警报的第一规则集合;由所述策略控制器获得用于包括所述元件的一个或多个元件的组的第二简档,所述第二简档包括具有一个或多个警报的第二规则集合;所述策略控制器至少基于作为所述组的成员的元件来修改所述第一简档以生成包括所述第一规则集合和所述第二规则集合的修改的第一简档;以及由策略控制器向计算设备输出修改的第一简档。
[0013]在一个示例中,计算系统包括策略控制器,该策略控制器被配置为:获得虚拟化基础设施的元件的第一简档,第一简档包括具有一个或多个警报的第一规则集合;获得包括所述元件的一个或多个元件的组的第二简档,所述第二简档包括具有一个或多个警报的第二规则集合;至少基于作为该组的成员的元件来修改第一简档以生成包括第一规则集合和第二规则集合的经修改的第一简档;并向计算设备输出修改的第一简档。所述计算系统还包括所述计算设备,所述计算设备包括处理电路和存储指令的至少一个存储设备,所述指令在被执行时将所述处理电路配置为:响应于确定一个或多个使用度量触发第二规则集合的所述一个或多个警报中的至少一个,确定经修改的第一简档是活动的;并输出修改的第一简档是活动的指示。
[0014]在一个示例中,一种包括指令的计算机可读存储介质,所述指令在被执行时配置计算系统的一个或多个处理器以:获得虚拟化基础设施的元件的第一简档,所述第一简档包括具有一个或多个警报的第一规则集合;获得包括所述元件的一个或多个元件的组的第二简档,所述第二简档包括具有一个或多个警报的第二规则集合;至少基于作为组的成员的元件来修改第一简档,以生成包括第一规则集合和第二规则集合的经修改的第一简档;并向计算设备输出经修改的第一简档。
[0015]在另一示例中,一种计算系统包括多个基于云的计算集群,基于云的计算集群中的每一个包括:一个或多个计算节点;一个或多个策略代理,被配置为在计算节点上执行以监视与计算节点的资源有关的性能和使用度量;以及策略控制器,被配置为将策略部署到策略代理并从策略代理接收性能和使用度量。多集群面板软件系统被配置为从多个基于云的计算集群的控制器中的每一个接收数据。策略控制器中的每一个被配置为通过针对计算集群的基础设施元件的一个或多个规则集合的应用来评估相应计算集群的性能和使用度量。策略控制器中的每一个基于对集群的性能和使用度量的评估来向多集群面板软件系统输出指示基础设施元件的当前健康状况的数据。多集群面板软件系统数据输出呈现针对基于云计算集群中的每一个的当前健康状况的单个用户界面屏幕。
[0016]在另一示例中,一种方法包括在多个不同的基于云的计算集群的计算节点上执行策略代理,以监视与计算集群中的每一个内的计算节点的资源相关的性能和使用度量。该方法还包括用计算集群中的每一个的相应策略控制器接收来自相应计算集群的计算节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户界面方法,包括:由控制器从多个策略代理的第一子集接收关于第一计算集群内的第一多个计算节点的使用度量的信息;由所述控制器从所述多个策略代理的第二子集接收关于第二计算集群内的第二多个计算节点的使用度量的信息,其中所述第一计算集群和所述第二计算集群被包括在多个计算集群中;由所述控制器基于被应用于关于所述第一多个计算节点的所述使用度量的所述信息的第一规则集,生成所述第一计算集群中的基础设施元件的第一健康状态;由所述控制器基于被应用于关于所述第二多个计算节点的所述使用度量的所述信息的第二规则集,生成所述第二计算集群中的基础设施元件的第二健康状态;由所述控制器维护用于存储针对所述多个计算集群中的每个计算集群的认证令牌的数据存储库;由所述控制器输出多集群用户界面,用于在单视图中向用户呈现关于所述第一计算集群中的所述基础设施元件的所述第一健康状态和第二计算集群中的所述基础设施元件的所述第二健康状态的信息两者;以及由所述控制器在所述多集群用户界面和单集群用户界面之间进行切换,其中所述单集群用户界面呈现关于所述多个计算集群中的任一计算集群中的基础设施元件的健康状态的信息,并且其中切换包括访问所述数据存储库中的所述认证令牌中的认证令牌,并且呈现所述单集群用户界面,而无需重新认证所述用户。2.根据权利要求1所述的方法,其中呈现关于健康状态的信息的所述单集群用户界面包括:单集群用户界面,所述单集群用户界面呈现关于所述第一计算集群中的所述基础设施元件的所述第一健康状态的信息,但不呈现关于所述第二计算集群中的所述基础设施元件的所述第二健康状态的信息。3.根据权利要求2所述的方法,其中所述认证令牌是第一认证令牌,并且所述单集群用户界面是第一单集群用户界面,所述方法还包括:由所述控制器切换到第二单集群用户界面,所述第二单集群用户界面呈现关于所述第二健康状态的信息但不呈现关于所述第一健康状态的信息,其中切换包括访问所述认证令牌中的第二认证令牌并且呈现所述第二单集群用户界面,而无需重新认证所述用户。4.根据权利要求1

3中的任一项所述的方法,其中所述多集群用户界面包括:在所述多集群用户界面中的多个图形区域中的一个图形区域内被呈现的关于所述第一健康状态的信息,以及在所述多集群用户界面内的所述图形区域中的一个不同图形区域内被呈现的关于所述第二健康状态的信息。5.根据权利要求1

3中的任一项所述的方法,其中所述多集群用户界面包括所述多集群用户界面内的多个图形区域中的每个图形区域内的多个图形块;其中所述图形块中的每个图形块对应于不同类型的基础设施元件并且包括正被监视的基础设施元件的整数计数,并且
其中所述图形块中的每个图形块具有指示所述类型的基础设施元件是否已被确定为不健康的外观。6.根据权利要求1

3中的任一项所述的方法,其中所述单集群用户界面包括所述单集群用户界面内的多个图形区域中的每个图形区域内的多个图形块;其中所述图形块中的每个图形块对应于不同类型的基础设施元件并且包括正被监视的基础设施元件的整数计数,并且其中所述图形块中的每个图形块具有指示所述类型的基础设施元件是否已被确定为不健康的外观。7.根据权利要求1

6中的任一项所述的方法,其中所述数据存储库是哈希表,并且其中使得能够在所述多集群用户界面和所述单集群用户界面之间进行切换包括:访问先前被存储在所述哈希表中的所述认证令牌中的认证令牌。8.根据权利要求1

7中的任一项所述的方法,其中所述第一健康状态是当前第一健康状态,其中所述第二健康状态是当前第二健康状态,其中生成所述当前第一健康状态包括生成指定对所述第一计算集群中的所述基础设施元件的先前第一健康状态的改变的第一差异信息,并且其中生成所述当前第二健康状态包括生成指定对所述第二计算集群中的所述基础设施元件的先前第二健康状态的改变的第二差异信息。9.根据权利要求8所述的方法,其中生成所述第一差异信息包括指定所述第一计算集群中具有改变的健康状态的基础设施元件的数目的计数;并且其中生成所述第二差异信息包括指定所述第二计算集群中具有改变的健康状态的基础设施元件的数目的计数。10.一种控制器,包括存储设备和处理电路,其中所述处理电路具有对所述存储设备的访问并且被配置为:从多个策略代理中的第一子集接收关于第一计算集群内的第一多个计算节点的使用度量的信息;从多个策略代理的第二子集接收关于第二计算集群内的第二多个计算节点的使用度量的信息,其中所述第一计算集群和所述第二计算集群被包括在多个计算集群内;基于被应用于关于所述第一多个计算节点的所述使用度量的信息的第一规则集,生成所述第一计算集群中的基础设施元件的第一健康状态;基于被应用于关于所述第二多个计算节点的所述使用度量的所述信息的第二规则集,生成所述第二计算集群中的基础设施元件的第二健康状态;维护用于存储所述多个计算集群中的每个计算集群的认证令牌的数据存储库;输出多集群用户界面,用于在单视图中向用户呈现关于所述第一计算集群中的所述基础设施元件的所述第一健康状态和所述第二计算集群中的所述基础设施元件的所述第二健康状态的信息两者;以及在所述多集群用户界面和单集群用户界面之间进行切换,其中所述单集群用户界面呈现关于所述多个计算集群中的任一计算集群中的基础设施元件的健康状态的信息,并且其
中切换包括访问所述数据存储库中的所述认证令牌中的认证令牌并且呈现所述单集群用户界面,而无需重新认证所述用户。11.根据权利要求10所述的控制器,其中呈现关于健康状态的信息的所述单集群用户界面包括:单集群用户界面,所述单集群用户界面呈现关于所述第一计算集群中的所述基础设施元件的所述第一健康状态的信息,但不呈现关于所述第二计算集群中的所述基础设施元件的所述第二健康状态的信息。12.根据权利要求11所述的控制器,其中所述认证令牌是第一认证令牌,其中所述单集群用户界面是第一单集群用户界面,并且其中所述处理电路还被配置为:切换到第二单集群用户界面,所述第二单集群用户界面呈现关于所述第二健康状态的信息但不呈现关于所述第一健康状态的信息,其中切换包括访问所述认证令牌中的第二认证令牌并且呈现所述第二单集群用户界面,而无需重新认证所述用户。13.根据权利要求10

12中的任一项所述的控制器,其中所述多集群用户界面包括:在所述多集群用户界面内的多个图形区域中的一个图形区域内被呈现的关于所述第一健康状态的信息,和在所述多集群用户界面内的所述图形区域的一个不同图形区域内被呈现的关于所述第二健康状态的信息。14.一种计算系统,包括用于执行根据权利要求1

9中的任一项所述的方法的装置。15.一种计算机可读介质,被编码有用于使一个或多个可编程处理器执行根据权利要求1

9中的任一项所述的方法的指令。16.一种用户界面方法,包括:通过控制器使得多个策略代理能够监视第一计算集群内的第一多个计算节点中的每个计算节点的使用度量并且监视第二计算集群内的第二多个计算节点中的每个计算节点的使用度量;由所述控制器从所述多个策略代理接收关于所述第一多个计算节点的所述使用度量的信息和关于所述第二多个计算节点的所述使用度量的信息;由所述控制器基于被应用于关于所述第一多个计算节点的所述使用度量的所述信息的第一规则集来评估所述第一计算集群的基础设施元件;由所述控制器基于被应用于关于所述第二多个计算节点的所述使用度量的所述信息的第二规则集来评估所述第二计算集群的基础设施元件;由所述控制器生成健康数据,所述健康数据包括所述第一集群的所述基础设施元件的第一健康状态和所述第二集群的所述基础设施元件的第二健康状态;以及由所述控制器输出用于呈现为多集群面板的用户界面,其中所述用户界面呈现关于所述第一健康状态和所述第二健康状态的信息。17.根据权利要求16所述的方法,其中输出所述用户界面包括:使得能够呈现单用户界面显示,所述单用户界面显示具有被布置在所述单用户界面显示内的多个图形区域,其中所述单用户界面显示在所述图形区域中的一个图形区域内呈现关于所述第一健康状态的信息,并且在所述图形区域中的一个不同图形区域内呈现关于所述第二健康状态的信息。
18.根据权利要求17所述的方法,其中输出所述用户界面包括:使得能够在所述多个图形区域的每个图形区域内呈现多个图形块;并且其中所述图形块中的每个图形块对应于不同类型的基础设施元件并且包括正被监视的基础设施元件的整数计数,并且其中所述图形块中的每个图形块具有指示特定类型的基础设施元件是否已被确定为不健康的外观。19.根据权利要求16

18中的任一项所述的方法,其中输出所述用户界面包括:输出第一单集群用户界面以呈现为针对所述第一集群的单集群面板,其中所述第一单集群用户界面呈现关于所述第一计算集群的健康状态信息,但不呈现关于所述第二计算集群的健康状态信息;以及输出第二单集群用户界面以呈现为针对所述第二集群的单集群面板,其中所述第二单集群用户界面呈现关于所述第二计算集群的健康状态信息,但不呈现关于所述第一计算集群的健康状态信息。20.根据权利要求19所述的方法,还包括:由所述控制器使得能够在所述多集群面板、针对所述第一集群的所述单集群面板和针对所述第二集群的所述单集群面板之间进行切换,而无需重新认证所述用户。21.根据权利要求19所述的方法,还包括:由所述控制器维护存储针对所述计算集群中的每个计算集群的认证令牌的哈希表;由所述控制器响应于输入,在所述多集群面板、针对所述第一集群的所述单集群面板和针对第二集群的所述单集群面板之间进行切换,而无需通过利用来自所述哈希表的所述认证令牌来重新认证用户。22.根据权利要求16

21中的任一项所述的方法,其中所述第一规则集包括第一组警报;并且其中所述第二规则集包括第二组警报。23.根据权利要求22所述的方法,其中所述第一规则集包括针对所述第一组警报的的第一组已分配权重;以及其中所述第二规则集包括针对所述第二组警报的第二组已分配权重。24.根据权利要求23所述的方法,其中生成所述健康数据包括:通过将所述第一组已分配权重应用于所述第一组警报并且通过将所述第二已分配权重应用于所述第二组警报来生成健康数据。25.根据权利要求16

24中的任一项所述的方法,其中所述第一健康状态是当前第一健康状态,其中所述第二健康状态是当前第二健康状态,并且其中生成健康数据包括:生成指定对所述第一集群的基础设施元件的先前第一健康状态的改变的第一差异信息;以及生成指定对所述所述第二集群的基础设施元件的先前第二健康状态的改变的第二差异信息。26.根据权利要求25所述的方法,其中所...

【专利技术属性】
技术研发人员:H
申请(专利权)人:瞻博网络公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1