当前位置: 首页 > 专利查询>微软公司专利>正文

复杂分布式应用程序中的自动化恢复和升级制造技术

技术编号:8165697 阅读:169 留言:0更新日期:2013-01-08 12:27
复杂分布式应用程序环境中基于检测到的硬件和/或软件问题的警告被映射到恢复动作以自动地解决问题。未被映射的警告通过循环升级方法被升级给指定个体或团队,该方法包括来自指定个体或团队的确认交接通知。升级过程中为每个警告收集的信息和方案可被记录以扩展自动化解决知识库。

【技术实现步骤摘要】
【国外来华专利技术】复杂分布式应用程序中的自动化恢复和升级
技术介绍
在今天的联网通信环境中,很多过去由本地执行的应用程序所提供的服务现在通过分布式服务来提供。例如,电子邮件服务、日历/日程安排服务和类似服务是通过复杂的联网系统提供的,其中联网系统涉及多个物理的和虚拟的服务器、存储设施和其它跨越地理边界的组件。即使诸如企业网络等组织系统也可能通过物理上分开的服务器场实现,等坐寸O尽管分布式服务使得更易于管理应用程序的安装、更新和维护(例如,代替安装、更新和维护成百的一假如不是成千的话一本地应用程序,中央管理的服务可以照看这些任务),此类服务仍涉及在多个服务器上执行的多个应用程序。在连续地管理此类大规模 分布式应用程序时,可预期各种问题。硬件故障、软件问题和其他预料外的失灵可能会定期发生。试图管理并从此类问题中手动恢复可能需要成本过高的数量的专职的并有丰富领域知识的运营工程师。
技术实现思路
提供本
技术实现思路
以便以简化的形式介绍将在以下的具体实施例中进一步描述的一些概念。本
技术实现思路
并不旨在专门标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。各实施例涉及将检测到的警告映射到恢复动作,从而在联网通信环境中自动地解决问题。未被映射的警告可通过循环升级方法升级给指定个体,该方法包括来自指定个体的确认交接通知。根据一些实施例,在升级过程中为每个警告收集的信息以及方案可被记录以便扩展自动化解决知识库。通过阅读下面的详细描述并参考相关联的附图,这些及其他特点和优点将变得显而易见。可以理解,前述一般描述和以下的详细描述都是说明性的,并且不限制所要求保护的各方面。附图说明图I是检测到警告可能导致修复动作或者警告升级的示例环境的概念图;图2是示出警告升级期间的动作的动作图;图3是示出多区域环境中的警告管理的另一概念图。图4是联网环境,其中可实现根据实施例的系统;图5是可实现各实施例的示例计算操作环境的框图;以及图6是示出根据各实施例的联网通信环境中的警告的自动化管理的逻辑流程图。具体实施例如以上简要描述的,联网系统中的警告可通过自动化动作/升级过程管理,其中自动化动作/升级过程使用映射到警告的动作和/或用于手动解决的升级,同时扩展知识库中自动化动作的部分并将收集的信息提供给有解决所述问题的任务的指定个体。在以下详细描述中,参考了构成详细描述的一部分并作为说明示出各个具体实施例或示例的附图。可组合这些方面,可利用其他方面,并且可以做出结构上的改变而不背离本专利技术的精神或范围。因此,以下详细描述并不旨在限制,并且本专利技术的范围由所附权利要求及其等效方案来限定。尽管在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文中描述了各实施例,但是本领域的技术人员会认识到各方面也可以结合其它程序模块实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本领域的技术人员可以明白,各实施例可以用其他计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器的或可编程消费电子产品、小型计算机、大型计算机以及类似计算设备。各实施例还能在任务由通过通信网络链接的远程处理设备来执行的分布式计算环境中实现。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。各实施例可被实现为计算机实现的过程(方法)、计算系统、或者诸如计算机程序产品或计算机可读介质等制品。计算机程序产品可以是计算机系统可读并且编码包括用于使计算机或计算系统执行示例过程的指令的计算机程序的计算机存储介质。例如,计算机可读存储介质可经由易失性计算机存储器、非易失性存储器、硬盘驱动器、闪存驱动器、软盘或紧致盘和类似介质中的一个或多个来实现。计算机程序产品也可以是计算系统可读并且对用于执行计算机过程的指令的计算机程序编码的载体(例如,频率或相位调制信号)上的传播信号。对服务的引用贯穿本说明书。此处使用的服务描述任何可接收警告作为其常规操作的一部分并处理/存储/转发此信息的联网/在线应用程序。此类应用程序可在单个计算设备、交互式的多个计算设备以及诸如此类上执行。各实施例还可在在多个服务器或类似系统上执行的托管服务中实现。术语“服务器”一般指通常在联网环境中执行一个或多个软件程序的计算设备。然而,服务器还可以被实现为在被视作网络上的服务器的一个或多个计算设备上执行的虚拟服务器(软件程序)。在下面将提供关于这些技术和示例操作的详细细节。参考图1,概念图100示出了检测到警告可导致修复动作或警告升级的示例环境。如之前简要提到的,各实施例通过自动化修复动作和警告升级来解决技术支持服务的复杂性。例如,在分布式技术支持服务系统中,监视引擎103可在检测到分布式系统中的硬件、软件或硬件/软件组合的问题时向自动化引擎102发送警告113。自动化引擎102可试尝试将警告113映射到修复动作112。如果自动化引擎102成功地将警告113映射到修复动作112,那么自动化引擎102可执行修复动作112,修复动作可包括用于解决检测到的问题的一组指令。问题可与地理上为分布式的服务地点105中的一个或多个设备104相关联。设备可包括任何计算设备,诸如台式计算机、服务器、智能电话、膝上型计算机以及类似计算设备。设备104还可包括附加的远程可访问设备,诸如监视器、音频设备、电视机、视频捕捉设备及其他类似设备。警告113可包括与检测到的问题相关联的设备或程序的状态信息,诸如设备存储器的内容、传感器读数、最后执行的指令,以及其他信息。警告113还可包括问题描述,诸如哪一指令执行失败、哪些执行指示了超出预定限制的结果,以及类似描述。自动化引擎102可尝试通过搜索故障诊断数据库114将警告113映射到修复动作112。故障诊断数据库114可存储匹配到由设备或软件程序进一步分类的修复动作的警告的档案。一示例实现可以是匹配到重启通信设备网络接口的修复动作的通信设备的“无连接”警告。一个或多个修复动作可被映射到每个警告。此外,一个或多个警告可被映射到单个修复动作。如果自动化引擎102为警告确定了多个修复动作,执行优先级可取决于各修复动作的预定优先级。例如,以上讨论的场景中主要的修复动作可能是重启网络接口,随后是重新引导通信设备的次级修复动作。修复动作的预定优先级可被手动输入到故障诊断数据库 114中,或者基于修复动作成功评估方案在问题得到成功修正时自动地确定。根据一些实施例,修复动作112可包括收集来自与所述问题相关联的设备和/或软件程序的附加诊断信息。根据其他实施例,附加诊断信息可作为重启自动化循环的警告发送到监视引擎。作为对警告的响应,附加诊断信息还可被收集并存储在系统中。存储的信息可用来捕捉问题状态和提供当警告被升级给指定个人或团队(例如,101)时的上下文。如果自动化引擎102未在故障诊断数据库114中找到映射的修复动作,警告113可被升级给指定的个人或团队101。即使映射的动作被找到并为了信息的目的而执行了,也可通知指定的个人或团队101。发送警告113给指定的个人或团队101可根据警告113的命名约定来确定。警告的命名约定可指示警告应升级给哪个支持人员,诸如硬件支持团队、软件支持团队以及类似人员等。命名约定方案还可用来本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J·阿夫纳S·布拉迪严永文志田治哉S·亚济乔鲁A·卢基扬诺夫B·阿林尔C·纳什
申请(专利权)人:微软公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1