System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 接收外部信息并且包含短期和长期资源规划的异常感知云资源管理系统技术方案_技高网

接收外部信息并且包含短期和长期资源规划的异常感知云资源管理系统技术方案

技术编号:41408941 阅读:2 留言:0更新日期:2024-05-20 19:36
一种云计算系统(10)中的异常感知资源管理系统(14)监控在所述云(10)中执行的电信应用,并且基于与所述应用的资源使用率和/或性能相关的内部度量以及来源于从所述云外部的系统获得的信息的外部度量来检测或预测异常。组合(210)所述内部和外部度量以生成组合度量,其被存储。基于所述组合度量和历史数据,检测或预测(212)异常。部分基于所检测或预测的异常,预报电信业务。基于短期优化策略和预报业务的部分,执行应用资源分配的短期资源演算。基于所述短期演算和长期优化策略,执行应用资源分配的长期优化。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术通常涉及计算机系统管理,并且特别涉及一种接收外部信息并且包含短期和长期资源规划的异常感知云资源管理的方法和系统。


技术介绍

1、“云”是对于通过各种网络(包含互联网)连接的众多的私人托管和公共托管的数据中心中的计算系统通用术语。每个数据中心提供计算资源的共享池,包含例如服务器以及其他计算硬件、数据存储、网络接口、操作系统、应用、服务和诸如此类。订户在云服务器上远程运行应用并且在云数据存储机构中存储数据。订户通常经由诸如互联网的网络访问他们的数据以及与所述应用通过接口连接。数据中心运营商向每个应用分配计算资源,诸如计算硬件、数据存储和诸如此类。

2、云向订户提供众多好处,包含从带有互联网连接性的任何装置访问他们的数据以及运行他们的应用的能力。数据中心运营商执行日常技术任务,诸如替换故障硬件、备份数据、升级软件、提供对不断演进的恶意软件威胁和诸如此类的快速保护。数据中心具有多个冗余电源,使得它们免受于本地停电。数据中心可以在地理上分布,使得云对本地天气或其他自然灾害的影响是能复原的。云缓解了订户对于拥有和运行他们自己的信息技术(it)资产的技术专业知识的需要和费用。

3、订户的应用范围从非常小(诸如个人访问电子邮件服务器)到巨大(诸如实现区域或国家电信网络的一些或所有核心网络节点的功能性)。数据中心运营商根据应用的大小和需要向它们分配计算资源。此类分配可能是动态的,通过将来自共享池的资源分配到应用(依赖于该应用的持续存在的需要)。数据中心运营商和订户协商对于应用的预期性能参数(例如关键性能指标,或kpi)的值的预定范围,并且同意该应用的预期资源使用的预定范围以取得所要求的性能。可以记录kpi和其他元数据,并且预期性能/资源参数的范围定期调整以符合实际使用。预期应用性能和资源使用的预定范围可以在服务级别协议(sla)中量化。

4、应用性能和/或资源使用中的异常是已知的,并且可以由许多不同原因引起。例如,访问应用的用户增加(负载尖峰)、组件故障或网络中断、恶意攻击和诸如此类,全都可以有害影响应用的性能。如本文中使用的,计算系统“异常”是指应用的性能落在它的预期性能的预定范围之外,和/或该应用的对于计算资源的需要超出该应用的预期资源使用的预定范围。面对此类异常,数据中心运营商可手动地或经由自动异常检测和解决系统(adrs)增加分配到应用的计算资源,以尝试将所述性能保持在sla限制内。例如,kardani-moghaddam等人在2021年3月1日发表在刊物《ieee transactions on parallel anddistributed systems》第32卷第3期第514-526页的论文“adrl:a hybrid anomaly-awaredeep reinforcement learning-based resource scaling in clouds”中描述了此类系统,其公开内容以其整体通过引用被结合于此。

5、此类异常感知云资源管理工具可检测异常的模式并且采取纠正动作以减轻或甚至防止云应用的性能恶化。它们监控该应用的若干度量并且可演算具有异常的概率或分数。然而,资源使用和性能的内部度量(意味着从计算系统内的条件或事件捕捉的那些度量,诸如cpu使用率、存储器使用、数据或消息吞吐量、延迟、服务质量(qos)和诸如此类)不总是显现与异常的强相关,特别是当由外部事件或条件触发异常时。例如,在电信应用中,在云外部的事件,诸如交通事故、地震或诸如此类,将导致业务大的增加(因为用户发出更多呼叫)。然而,传统的异常感知云资源管理工具仅当所述影响抵达该应用时(即,当业务负载充溢一些核心网络节点时)才会检测异常。因此,任何补救动作(诸如分配额外资源以处置增加的通话量)必然是太晚的。该应用性能将早已变差,并且一些通话可能被丢弃(drop)、用户不能访问网络或其他qos的恶化将已经发生。

6、云管理的另一已知领域是资源优化。资源优化算法被广泛采用以尽可能成本高效地托管并且执行应用。然而,这些技术通常仅针对短期进行优化。返回到电信应用作为示例,可假设:用户业务不是提前非常远精确可预测的。如果对应用的资源的重新分配的成本是不可忽略的,那么短期优化可能导致长期运行中的次优资源管理。

7、提供本文档的
技术介绍
部分以将本专利技术的实施例置于技术和操作的上下文中,以协助那些本领域的技术人员理解它们的范围和效用。可以进行
技术介绍
部分中描述的方法,但不必要是以前已被设想或进行的方法。除非被明确指出为是如此,否则本文中没有陈述仅通过其包含在
技术介绍
部分中就被承认为是现有技术。


技术实现思路

1、以下内容呈现了本公开的简化概述,以便向那些本领域的技术人员提供基本理解。该概述不是本公开的广泛概观并且也不旨在识别本专利技术的实施例的关键/重要元素或描绘本专利技术的范围。本概述的唯一目的是以简化的形式呈现本文中公开的一些概念,作为之后呈现的更详细描述的前奏。

2、根据本文中描述并且要求保护的一个或多个实施例,一种云计算系统中的异常感知资源管理系统监控在云中执行的应用,诸如电信应用,并且基于与该应用的资源使用率和/或性能相关的内部度量以及来源于从云外部的系统获得的信息的外部度量来检测或预测异常。外部信息提取和分析功能从外部信息生成外部度量。合并功能组合内部和外部度量以生成组合度量,其被存储。基于组合度量和历史数据,检测或预测异常。当该应用的资源使用落在预期资源使用的预定范围之外和/或该应用的性能落在预期性能的预定范围之外时,异常发生。部分地基于所检测或预测的异常,预报电信业务。基于短期优化策略和预报业务的部分,执行应用资源分配的短期资源演算。基于所述短期演算和长期优化策略,执行应用资源分配的长期优化。

3、一个实施例涉及一种管理计算系统内的计算资源的方法。以应用的预期资源使用的预定范围和该应用的预期性能的预定范围在计算系统中执行该应用。监控该应用执行,并且生成与该应用的性能和资源使用相关的内部度量。接收与计算系统外部的事件相关的信息。从所接收的信息提取外部度量。合并外部和内部度量以生成组合度量。基于所述组合度量,检测或预测异常,其中,该应用的资源使用落在预期资源使用的预定范围之外,和/或该应用的性能落在预期性能的预定范围之外。基于所检测或预测的异常,确定由该应用要求的计算资源。

4、另一实施例涉及一种在计算系统中执行的异常感知资源管理系统。所述计算系统执行电信应用并且从外部系统接收信息。异常感知资源管理系统包含数据存储和计算资源。所述计算资源配置成实现:系统监控功能,其配置成监控该应用并且生成与该应用的资源使用率和/或性能相关的内部度量;信息提取和分析功能,其配置成接收来自外部系统的信息和来自数据存储的历史数据,并且还配置成生成外部度量;以及特征合并功能,其配置成接收内部和外部度量,并且还配置成生成组合度量。数据存储配置成存储组合度量。异常感知资源管理系统还包含异常检测功能,其配置成接收组合度量和来自数据存储的历史数据,并且还配置成检测或预测异常本文档来自技高网...

【技术保护点】

1.一种管理计算系统内的计算资源的方法(200),包括:

2.如权利要求1所述的方法(200),还包括保存所述组合度量,并且其中,检测或预测异常还基于组合度量的历史值。

3.如权利要求2所述的方法(200),其中,所述应用是电信应用,并且还包括:

4.如权利要求3所述的方法(200),其中,基于所检测或预测的异常来确定(214)由所述应用要求的计算资源包括:

5.如权利要求4所述的方法(200),其中,演算由所述应用要求的短期资源包括基于预报业务、由所述计算系统的运营商提供的短期优化策略、以及所检测或预测的异常来演算被要求的所述短期资源。

6.如权利要求4所述的方法(200),其中,优化由所述应用要求的长期资源还基于由所述计算系统的运营商提供的长期优化策略,以及所检测或预测的异常。

7.如权利要求6所述的方法(200),还包括向所述应用分配所优化的长期资源。

8.如权利要求6所述的方法(200),其中,演算由所述应用要求的短期资源包括,对于多个时间间隔i的每个:

9.如权利要求8所述的方法(200),其中,基于所述短期资源演算来优化由所述应用要求的长期资源包括,对于演算短期资源分配si所针对的每个时间间隔i,基于成本函数来确定表示对于该间隔i的资源的最终优化分配的判定di,所述成本函数包括表示分配高于短期优化值的额外资源之成本的闲置成本,以及反映在间隔i之间改变所述资源分配之成本的适应成本。

10.如权利要求9所述的方法(200),其中,所述成本函数是

11.如权利要求10所述的方法(200),其中,对于每一间隔i,si≤di。

12.如权利要求11所述的方法(200),还包括通过以下步骤在没有约束的情况下演算对所述成本函数的最优解:

13.如权利要求12所述的方法(200),还包括应用以下约束:对于每个间隔i,如果未约束的最优分配那么

14.一种在计算系统(10)中执行的异常感知资源管理系统(14),所述计算系统(10)执行电信应用并且从外部系统(16)接收信息,所述异常感知资源管理系统(14)包括:

15.如权利要求14所述的系统(14),其中,所述计算资源还配置成实现:

16.如权利要求15所述的系统(14),其中,所述短期资源演算功能(32)配置成通过以下步骤来演算对于所述应用的短期资源分配:针对多个时间间隔i的每个:

17.如权利要求15所述的系统(14),其中,所述长期资源优化功能(36)配置成通过以下步骤来优化对于所述应用的长期资源分配:对于演算短期资源分配si所针对的每个时间间隔i,基于成本函数来确定表示对于该间隔i的资源的最终优化分配的判定di,所述成本函数包括表示分配高于短期优化值的额外资源之成本的闲置成本,以及反映在间隔i之间改变所述资源分配之成本的适应成本。

18.如权利要求17所述的系统(14),其中,所述成本函数是

19.如权利要求18所述的系统(14),其中,对于每一间隔i,si≤di。

20.如权利要求19所述的系统(14),其中,所述长期资源优化功能(36)还配置成通过以下步骤在没有约束的情况下演算对所述成本函数的最优解:

21.如权利要求20所述的系统(14),其中,所述长期资源优化功能(36)还配置成应用以下约束:对于每个间隔i,如果未约束的最优分配那么

22.一种非暂态计算机可读介质,含有指令,所述指令可操作以使计算系统(10)中的计算资源实现异常感知资源管理系统(14),其配置成使所述计算资源执行以下步骤:

...

【技术特征摘要】
【国外来华专利技术】

1.一种管理计算系统内的计算资源的方法(200),包括:

2.如权利要求1所述的方法(200),还包括保存所述组合度量,并且其中,检测或预测异常还基于组合度量的历史值。

3.如权利要求2所述的方法(200),其中,所述应用是电信应用,并且还包括:

4.如权利要求3所述的方法(200),其中,基于所检测或预测的异常来确定(214)由所述应用要求的计算资源包括:

5.如权利要求4所述的方法(200),其中,演算由所述应用要求的短期资源包括基于预报业务、由所述计算系统的运营商提供的短期优化策略、以及所检测或预测的异常来演算被要求的所述短期资源。

6.如权利要求4所述的方法(200),其中,优化由所述应用要求的长期资源还基于由所述计算系统的运营商提供的长期优化策略,以及所检测或预测的异常。

7.如权利要求6所述的方法(200),还包括向所述应用分配所优化的长期资源。

8.如权利要求6所述的方法(200),其中,演算由所述应用要求的短期资源包括,对于多个时间间隔i的每个:

9.如权利要求8所述的方法(200),其中,基于所述短期资源演算来优化由所述应用要求的长期资源包括,对于演算短期资源分配si所针对的每个时间间隔i,基于成本函数来确定表示对于该间隔i的资源的最终优化分配的判定di,所述成本函数包括表示分配高于短期优化值的额外资源之成本的闲置成本,以及反映在间隔i之间改变所述资源分配之成本的适应成本。

10.如权利要求9所述的方法(200),其中,所述成本函数是

11.如权利要求10所述的方法(200),其中,对于每一间隔i,si≤di。

12.如权利要求11所述的方法(200),还包括通过以下步骤在没有约束的情况下演算对所述成本...

【专利技术属性】
技术研发人员:M·古铁雷斯L·东嘉B·福多B·桑科利
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1