用于分布式事件分类和路由的系统和方法技术方案

技术编号:36922023 阅读:16 留言:0更新日期:2023-03-22 18:45
本公开的各方面涉及云环境中的事件路由。在一个示例中,云提供方团队利用侦察器框架来基于团队的专业知识构建团队特定侦察器。在示例中,检测到事件并将描述发送给每个团队特定侦察器。每个团队特定侦察器使用由团队提供的事件描述和侦察器规范来标识、访问、和处理来自云组件的与事件相关的监控数据。每个团队特定侦察器利用一个或多个机器学习模型来评估监控数据并生成有关团队是否负责解决事件的事件分类预测。在示例中,侦察器主管接收来自每个团队特定侦察器的预测,并比较这些预测以确定应将事件路由到哪个团队。确定应将事件路由到哪个团队。确定应将事件路由到哪个团队。

【技术实现步骤摘要】
【国外来华专利技术】用于分布式事件分类和路由的系统和方法

技术介绍

[0001]对于云环境中的云提供方,重要的是尽可能快速和有效地解决出现的任何问题或事件。为此,应将事件指派给最能够快速解决该事件的(多个)资源。快速解决问题对于维持服务水平目标很重要,而有效地解决事件对于快速解决和避免浪费针对解决特定事件而言并非是最佳的资源都很重要。然而,现有的技术——诸如例如,依赖于人类来预测事件的原因并且相应地将事件路由到解决资源——既不快速也不高效。使用这些现有的技术,事件通常会被错误路由——也就是说,发送给无法解决事件或无法像另一团队那样有效地解决事件的团队。事件的错误路由会延长服务水平的效果并且浪费资源,诸如团队成员试图解决其专业知识之外的事件所花费的时间。
[0002]关于这些和其他一般考虑,已经描述了实施例。此外,尽管已经讨论了相对具体的问题,但是应当领会,实施例不应限于解决
技术介绍
中所标识的具体问题。

技术实现思路

[0003]本公开的各方面涉及使用团队特定侦察器(例如,预测器)来做出决策,该决策可以被用来做出自动化事件路由决策。在一个示例中,团队负责云环境的某个部分,并且其成员拥有与云环境的该部分相关的专业知识。这个团队可以利用这种专业知识来创建或协助创建事件路由侦察器(scout)。在一些示例中,侦察器接收事件描述,并基于侦察器的规范,访问可能与事件相关的监控数据。然后,使用机器学习模型,侦察器可以评估所访问数据,以生成关于与侦察器相关联的团队是否将能够解决所描述事件的预测。
[0004]本公开的各方面还涉及接收来自多于一个团队特定侦察器的预测并且基于这些预测来决定将事件路由到哪里。在一个示例中,存在多于一个团队特定侦察器。在该示例中,每个团队特定侦察器接收事件描述,并且生成关于与侦察器相关联的团队是否将能够解决所描述事件的预测。预测聚合器或侦察器主管接收这些预测并决定将事件路由到哪个团队。
[0005]本公开的各方面涉及用于设计团队特定侦察器的框架。在示例中,向负责云环境的某个部分的团队提供了框架。在示例中,该框架可以包括向团队指示什么信息对构建团队特定侦察器有用的提示或指令。除其他之外,有用信息可以包括:团队通常利用的监控数据的类型、团队利用的监控数据的位置、用于处理团队通常利用的监控数据的指令、描述云组件之间的拓扑或依赖性的信息、或与侦察器如何基于事件描述来生成预测相关的任何其他信息。
[0006]该
技术实现思路
被提供来以简化的形式介绍一系列概念,这些概念将在下面的详细描述中进一步描述。该
技术实现思路
并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
附图说明
[0007]参考以下附图描述了非限制性和非穷举性示例。
[0008]图1A图示了用于云环境中的域特定事件路由的示例系统的概览。
[0009]图1B图示了用于云环境中的域特定事件路由的示例系统的概览。
[0010]图2图示了用于在云环境中生成事件分类预测的示例方法的概览。
[0011]图3图示了用于处理被标识为与事件相关的监控数据的示例方法的概览。
[0012]图4图示了用于筛选事件描述的示例方法。
[0013]图5图示了用于创建团队特定侦察器的示例方法。
[0014]图6图示了用于基于来自团队特定侦察器的事件分类预测来路由事件的示例方法。
[0015]图7图示了用于创建团队特定侦察器的示例方法。
[0016]图8A图示了事件路由组件之间的交互的示例流程图。
[0017]图8B图示了事件路由组件之间的交互的示例流程图。
[0018]图9是图示了可以用来实践本公开的各方面的计算设备的示例物理组件的框图。
[0019]图10A和图10B是可以用来实践本公开的各方面的移动计算设备的简化框图。
具体实施方式
[0020]在下面的详细描述中,对形成其一部分的附图进行参考,并且在附图中通过图示的方式示出了特定实施例或示例。在不背离本公开的情况下,可以组合这些方面,可以利用其他方面,并且可以进行结构改变。实施例可以作为方法、系统或设备来实践。因此,实施例可以采取硬件实现、完全软件实现或结合软件和硬件方面的实现的形式。因此,以下详细描述不应被理解为限制性的,并且本公开的范围由所附权利要求及其等同物来限定。
[0021]在云环境中,云提供方通过诸如互联网之类的网络向云客户提供存储、网络和计算服务。云提供方维护允许其云客户设计和部署多种程序、应用和服务所需的硬件、软件、基础设施和其他方面,因此他们的客户无需购买和维护本地部署(on

premise)计算资源。云提供方可以为其客户提供各种服务,诸如存储、计算或其组合。但是,为了向客户大规模提供这些服务,云提供方必须维护大量且种类繁多的云组件,这些云组件常常位于各种不同的物理位置。此外,云提供方和云客户在访问云资源时可以利用由第三方(诸如互联网服务提供方)提供的组件或服务。在云环境中,云组件彼此结合进行操作以允许云提供方向云客户提供计算服务。如果云组件发生故障,云提供方可能无法以客户期望的质量水平向其客户提供计算服务。或者,在组件故障的其他实例中,云提供方可能根本无法为其客户提供计算服务。如本文中所使用的,事件是指与预计或预期不同地运行的一个或多个云组件的任何此类实例。
[0022]在示例中,云提供方利用工程师团队来最小化事件的频率,并且当事件确实发生时,采取尽快解决事件所必要的操作。如本文中所使用的,团队可以是个人或一组个人。大型云提供方可以利用大量具有各种能力的此类团队。对于大型云提供方,团队可能存在也可能不存在于与云提供方相同的公司组织内。在示例中,团队可以是云提供方的员工。在其他示例中,团队可以是独立承包商。或者,在其他示例中,团队可以是其产品或服务与云环境交互的第三方的雇员,诸如互联网服务提供方。
[0023]在任何情况下,这些团队中的每一个都可能拥有与云环境的仅一部分相关的专业知识,而拥有关于云环境的其他部分的较少知识。因此,即使云提供方雇用或能接触到能够
快速解决事件的工程师团队,云提供方首先也必须标识其众多团队中的哪一个团队最能够解决该事件,并且将必须尽快向该团队提供解决该事件所需的信息。因此,本公开的各方面涉及将事件自动路由到最能够解决事件的团队。
[0024]在示例中,云提供方检测事件并生成事件描述。在一些示例中,云提供方定期监控云组件。通过这种定期监控,云提供方可以检测事件并生成包含有关检测到的信息的事件描述。如本文中所使用的,事件描述指的是描述事件的任何数据。事件描述可以包含对与预计或预期不同地运行的组件的自然语言描述。或者,事件描述可以是数据集,其表明云组件与预期不同地运行。除了通过定期监控来检测事件之外,云提供方还可以通过客户报告来检测事件。例如,云客户可能会经历云计算服务问题,并且可以将此问题报告给云提供方。客户的报告可以采取支持票的形式,并且可以包含描述客户的体验的信息。然后,这个信息可以被用作“事件描述”,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在云计算系统中生成事件分类预测的计算机实现的方法,所述方法包括:在本地侦察器组件处接收来自云计算系统的与事件相关的事件描述,其中所述本地侦察器组件与用户群组相关联,并且其中所述本地侦察器组件包括与所述用户群组相关的侦察器规范;基于所述侦察器规范从所述事件描述中标识与所述事件相关的云组件;标识与所述云组件相关联的监控数据;根据所述监控数据生成特征集;使用机器学习模型评估所述特征集以生成事件分类预测,其中所述事件分类预测包括关于所述用户群组是否对所述事件负责的二元决策;以及当确定所述用户群组对所述事件负责时,将所述事件路由到所述用户群组。2.根据权利要求1所述的方法,还包括:当确定所述用户群组不对所述事件负责时,提供关于为什么所述用户群组不对所述事件负责的解释。3.根据权利要求1所述的方法,其中标识所述监控数据还包括:使用所述侦察器规范来确定所述监控数据和所述云组件之间的关联。4.根据权利要求3所述的方法,其中标识所述监控数据还包括:使用所述侦察器规范来确定所述监控数据的位置。5.一种用于将与基于云的系统相关联的事件自动路由到负责解决所述事件的用户群组的方法,所述方法包括:在与第一用户群组相关联的第一本地侦察器组件处接收事件描述,其中所述第一本地侦察器组件包括与所述第一用户群组相关的第一侦察器规范;在与第二用户群组相关联的第二本地侦察器组件处接收所述事件描述,其中所述第二本地侦察器组件包括与所述第二用户群组相关的第二侦察器规范;使用机器学习模型基于所述事件描述和所述第一侦察器规范生成针对所述第一侦察器的第一事件分类预测,其中所述事件分类预测包括:指示所述第一用户群组是否对所述事件负责的第一关联性预测以及当所述第一关联性预测是肯定时的第一置信度值;使用所述机器学习模型基于所述事件描述和所述第二侦察器规范生成针对所述第二侦察器的第二事件分类预测,其中所述第二事件分类预测包括指示所述第二用户群组是否对所述事件负责的第二关联性预测以及当所述第二关联性预测是肯定时的第二置信度值;以及响应于确定所述第一事件分类预测和所述第二事件分类预测中的每一个都是肯定的:将所述第一事件分类预测的所述第一置信度值与所述第二事件分类预测的所述第二置信度值进行比较;以及响应于确定所述第一置信度值大于所述第二置信度值,将所述事件路由到所述第一用户群组。6.根据权利要求5所述的方法,其中所述第一本地侦察器组件和所述第二本地侦察器组件大致同时接收到...

【专利技术属性】
技术研发人员:B
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1