当前位置: 首页 > 专利查询>微软公司专利>正文

跨云管理和故障查找制造技术

技术编号:9622143 阅读:136 留言:0更新日期:2014-01-30 12:18
本文描述了向应用提供横跨两个或更多个云的能力的云管理系统,同时允许将分布式应用作为单个应用来进行操作、管理、以及故障查找。该系统提供跨各数据中心通信以执行并对应用的在不同的位置处运行的各实例的知识进行集中的基础结构。该系统所提供的基础结构监视该应用和各云之间的连接,具有知道问题是否处于应用内或是因为各云之间的连接的智能。该系统协调跨多个云平台/位置的管理功能。因而,该云管理系统创建跨多个云的单个监视和故障查找接口和知识以及执行结构,使得分布在多个云的各应用可被更容易地监视、管理以及调试。

Cross cloud management and troubleshooting

This article describes a cloud management system that provides applications with the ability to span two or more clouds, while allowing distributed applications to operate, manage, and fail to find as a single application. The system provides a centralized infrastructure for communicating across data centers to perform and knowledge of instances of applications running at different locations. The infrastructure provided by the system monitors the connection between the application and each cloud, and has the intelligence to know whether the problem is in application or because of the connection between the clouds. The system coordinates the management functions across multiple cloud platforms / locations. As a result, the cloud management system creates a single monitoring and fault finding interface and knowledge across multiple clouds, as well as an implementation structure that allows applications that are distributed across multiple clouds to be monitored, managed, and debugged more easily.

【技术实现步骤摘要】
【国外来华专利技术】用于跨云管理和故障查找的方法和系统
技术介绍
数据中心提供用于运行大型应用的服务器。企业通常使用数据中心来运行核心业务功能,诸如销售、营销、人力资源、记账、产品目录等。数据中心还可以运行诸如网站、web服务、电子邮件主机、数据库等面向顾客的应用,以及许多其他应用。数据中心通常是通过确定预期峰值负载并提供服务器、网络基础结构、冷却和其他资源以处理峰值负载水平来构建的。数据中心非常昂贵且在非峰值时间未被充分利用是公知的。就用于监视和执行对数据中心的维护的装备和人员两者而言,数据中心还涉及相对高的管理费用。由于几乎每一公司都使用某种数据中心,因此存在跨世界的组织所执行的许多冗余功能。出现了云计算作为传统数据中心的一种优化。云被定义成通过网络可用的、可针对企业的至少一些传统数据中心功能提供服务的资源集(例如,处理、存储或其他资源)。云通常涉及抽象层,使得云的应用和用户可能不知道在其中运行应用的具体硬件、该硬件位于何处等。这允许云运营商在使资源交替进出服务、维护等方面而言的某种附加的自由度。云可以包括公共云(诸如MICROSOFTTMAzure、AmazonWebServices及其他),以及私有云(诸如由EucalyptusSystems、MICROSOFTTM及其他所提供的那些云)。公司已开始供应企业可放置在其自己的数据中心中的设备(例如,MICROSOFTTMAzure设备)以连接具有变化的云功能级别的数据中心。即使当基于云的资源被利用时,具有数据中心的企业在增建大型数据中心时也招致巨大的成本。企业通常仍然计划了“最差情况”的峰值情形并由此包括许多硬件,其中至少一些硬件在额外处理容量、额外存储空间等方面很少被使用或未被充分利用。该额外资源量为很少的回报招致高成本。使用场所内基于云的计算的顾客期望能够针对峰值容量时间、针对灾难恢复情形或仅针对容量管理而使用另一兼容云(例如,其自身在另一位置的第二实例、微软的公共云等)中的容量。与为最差情况的情形而增建然后为冗余而翻倍相比,这样做便宜得多。另外,他们期望能够管理(例如,故障查找、操作)分散在多个云的应用。当前,应用、云管理、以及故障查找没有跨各个云或其他数据中心来操作。
技术实现思路
本文描述了向应用提供跨两个或更多个云(它可跨很大距离)的能力的云管理系统,同时允许将分布式应用作为单个应用来进行操作、管理、以及故障查找。该系统提供跨各数据中心通信以执行并对应用的在不同的位置处运行的各实例的知识进行集中的基础结构。在一些情况下,该系统提供企业可将其置于它自己的私有数据中心中的计算设备,同时经由该计算设备提供统一管理,该私有数据中心允许管理员将至少一些应用负载分布在公共云或其他分开的位置。该系统所提供的基础结构监视该应用和各云之间的连接两者,具有知道问题是处于应用内还是因为各云之间的连接的智能。该系统协调跨多个云平台/位置的管理功能。如果管理员想要调试该应用,则该系统允许通过无缝的统一接口来在正确的位置处进行实况调试。因而,该云管理系统创建跨多个云的单个监视和故障查找接口和知识以及执行“结构”,使得跨多个云分布的各应用可被更容易地监视、管理以及调试。提供本概述以便以简化形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。附图说明图1示出在一个实施例中在与管理基础结构相关联的两个云中运行的应用。图2是示出在一个实施例中的云管理系统的各组件的框图。图3是示出在一个实施例中云管理系统的用于处理来自管理工具的访问来自分布式应用实例的数据的请求的处理的流程图。图4是示出在一个实施例中云管理系统的用于从远程应用实例的位置处报告回数据并在远程应用实例的位置处处理故障查找请求的处理的流程图。具体实施方式本文描述了向应用提供跨两个或更多个云(它可跨很大距离)的能力的云管理系统,同时允许将分布式应用作为单个应用来进行操作、管理、以及故障查找。该系统提供跨各数据中心通信以执行并对应用的在不同的位置处运行的各实例的知识进行集中的基础结构。例如,该系统可以集中日志记录、性能跟踪以及其他管理功能,而不管该应用在何处运行。在一些情况下,该系统提供企业可将其置于它自己的私有数据中心中的计算设备,同时经由该计算设备提供统一管理,该私有数据中心允许管理员将至少一些应用负载分布在公共云或其他分开的位置。该云管理系统所提供的基础结构监视该应用和各云之间的连接两者,具有知道问题是否处于应用内或是因为各云之间的连接的智能。该系统协调跨多个云平台/位置的管理功能(从一个云的基础结构,任务被协调以跨两个或更多个云执行)。如果管理员想要调试该应用,则该系统允许通过无缝的统一接口来在正确的位置处进行实况调试。因而,该云管理系统创建跨多个云的单个监视和故障查找接口和知识以及执行“结构”,使得分布在多个云的各应用可被更容易地监视、管理以及调试。图1示出在一个实施例中在与管理基础结构相关联的两个云中运行的应用。在一些实施例中,云管理系统使用一个云中的基础结构来影响应用(和/或管理员),该云具有所有位置处的数据/访问所有位置处的数据以能够完全对该应用进行监视/故障查找。作为示例,考虑具有在两个云(在图1中示为云110和云150)中运行的实例的应用。云110包括包含基础结构130的微软TMAzure设备实例120。设备实例120包括运行角色140和角色145的应用实例125。第二云150包括运行角色160和角色170的应用实例155。第二云150还包括基础结构180。应用实例120知道这些角色中的每一个并且知道它们是同一应用的一部分。每一位置处的基础结构管道允许设备实例120检索与在第二云150处执行的角色160和角色170有关的信息。该系统可分布任一单独的角色、整个应用、或这两者。有了所有管理数据(例如,来自应用、机器、以及基础结构的日志),该系统可通过应用预定义的健康规则来评估该应用的健康,如同所有角色在本地一样。该系统还可查看跨这些位置的基础结构健康以及其间的连接190,以评估该应用或基础结构/网络是否发生了问题。类似地,在需要自动或手动故障查找或补救步骤时,云110中的基础结构130可与云150中的基础结构180进行协调以提供故障查找和调试支持。例如,该系统结构可以达到各个位置以执行应用范围的更新、关闭等。本领域普通技术人员将明白执行跨位置控制的多种方式。例如,基础结构130可直接控制基础结构180,基础结构130可请求基础结构180代表基础结构130来执行,等等。同样,有了操作员/管理员故障查找工具(例如,监视可视化、警报、日志以及配置数据查看,等等),应用和基础结构的位置是可用的并且在逻辑上被显示,但不涉及分开的工具和来自管理员的脑力体操来合在一起。例如,在对所有角色的数据进行故障查找和查看时,如果管理员105的下一步是使用一个或多个工具195来查看应用的日志或开始与角色实例的远程会话,则该系统直接连接管理员105,而不管该角色处于何处。该云管理系统的设计提供了服务跨多个云/位置的简化且一致的运行。该系统将“计算资源”的定义从服务器(数据中心以外)移至因特网的一部分(数据中心和它们之间的连接)。这允许在服务层定义、监视以及本文档来自技高网
...
跨云管理和故障查找

【技术保护点】
一种计算机实现的用于处理来自管理工具的访问来自各分布式应用实例的应用管理数据的请求的方法,所述方法包括:从应用管理工具接收访问与在一个或多个数据中心中运行各实例的应用有关的管理数据的请求;标识满足所接收到的请求的一个或多个类型的管理数据;确定包括所述应用的两个或更多个实例的应用分布;从每一分布式应用实例收集用于满足所述请求的管理数据;统一所收集的数据以提供对接收到的管理工具请求的统一响应;以及响应于所接收到的管理工具请求来报告所收集的和经统一的管理数据,其中前述步骤由至少一个处理器来执行。

【技术特征摘要】
【国外来华专利技术】2011.05.20 US 13/111,9561.一种计算机实现的用于处理来自管理工具的访问来自各分布式应用实例的应用管理数据的请求的方法,所述方法包括:从应用管理工具接收访问与在一个或多个数据中心中运行各实例的应用有关的管理数据的请求,其中接收所述管理请求包括从性能监视工具接收访问描述一个或多个应用实例的操作的状态信息的请求;标识满足所接收到的请求的一个或多个类型的管理数据;确定包括所述应用的两个或更多个实例的应用分布;从每一分布式应用实例收集用于满足所述请求的管理数据;统一所收集的数据以提供对接收到的管理工具请求的统一响应;以及响应于所接收到的管理工具请求来报告所收集的和经统一的管理数据,其中前述步骤由至少一个处理器来执行。2.如权利要求1所述的方法,其特征在于,接收所述管理请求包括通过展示给工具的用于请求管理数据的程序性应用编程接口来接收所述工具请求。3.如权利要求2所述的方法,其特征在于,所述应用编程接口包括用于访问管理数据而无需工具理解各应用实例在何处运行或在多少位置处运行的统一接口。4.如权利要求1所述的方法,其特征在于,标识各类管理数据包括确定所述请求要求所述应用的每一实例所产生的信息。5.如权利要求1所述的方法,其特征在于,标识各类管理数据包括确定从每一应用实例收集哪些信息以及所述数据是否已经在本地从由每一应用实例推送到中心位置的数据中进行了收集。6.如权利要求1所述的方法,其特征在于,确定所述应用的分布包括确定所述应用在何处运行以及系统将在何处找到用于满足所述请求的管理数据。7.如权利要求1所述的方法,其特征在于,收集管理数据包括访问私有数据中心中的至少一个实例和云计算设施中的至少一个实例。8.如权利要求1所述的方法,其特征在于,收集管理数据包括联系所述应用的每一实例以满...

【专利技术属性】
技术研发人员:K·C·艾耶E·B·沃森
申请(专利权)人:微软公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1