管理计算机服务器能力制造技术

技术编号:12307458 阅读:88 留言:0更新日期:2015-11-11 16:55
公开了用于使用机器学习(如,神经网络和/或组合学习)来解决服务器群(如,云资源)的供应预测的非线性问题的系统和方法。机器学习可使用诸如来自德国斯图加特大学的SNNS产品的可商购产品执行。包括用于机器学习的神经网络的系统提供了用于进行跟踪的输入和输出标识,并且系统提供它们之间的相互关系。代替静态规则,机器学习提供了结合对应的置信度分数的动态供应建议。基于由神经网络采集/测量的数据,供应建议将改变,置信度分数也会改变。

【技术实现步骤摘要】
【国外来华专利技术】管理计算机服务器能力的方法、装置和系统本国际申请要求2013年3月15日提交的编号为13/835,294(代理案号为007737.00106)的美国申请的优先权,其通过引用以其整体并入本文。
本申请总体涉及管理计算机服务器的能力。尤其是,本公开涉及学习和预测计算机服务器对一个或多个计算机中的会话进行负载均衡的能力。背景在可操作的环境中为终端用户提供共享的资源可能会提出对能力规划的挑战。当系统可确保资源以及时和合理的时间期限被传递给用户以便避免过载时终端用户的体验被优化。当系统过载或以其它方式不恰当地进行负载均衡时,系统可能不能够为用户在合理的时间期限内提供所需的资源从而降低了终端用户的用户体验。与尝试预报和规划特定用户需求的资源量相关的挑战有很多。现有的负载均衡系统未能充分地应对这些挑战。例如,在任意时刻,用户可能需求或多或少的资源。另外,用户可能不一直消耗这些资源,而是在实际上,这些资源的消耗量和周期可随着应用更新、附加应用的安装或用户行为的改变而变化。另外,当多个用户会话或用户共享硬件资源公共池时,挑战可能被加剧。预测物理计算机、服务器或其它基础设施可支持的用户量常常是困难的。在一些实施例中,管理员可先验地确定分配给每一个工作负载的硬件量。现有解决方案是不完善的并具有不足之处。同时,计算机学科存在被称为计算学习理论(CLT)的分支,其中分析了机器学习算法和它们的性能。CLT算法的性能可能变化很大;一些算法可在固定的时间期限内完成,而其它算法可能具有概率区间。另外,CLT算法的时间复杂度可具有积极或消极结果,这取决于算法的功能是否可在多项式时间内分别被学习。CLT算法有时可使用人工神经网络(如,连接模型)实施。斯图加特神经网络模拟器(SNNS)是在斯图加特大学的并行与分布式高性能系统研究所开发的用于神经网络的模拟器。SNNS模拟器200由四个主组件组成:模拟器内核、图形用户界面、批处理执行界面(如,batchman)和网络编译器(如,snns2c,其采取一些输入并将所训练的网络文件生成为C源码)。参考图2,模拟器核组件在神经网络的内部网络数据结构上操作并在其上执行操作。可建立在内核之上的图形用户界面给出了神经网络的图形表示并在模拟运行期间控制内核,其中包括以各种方式直接创建、操纵和可视化复杂的神经网络的能力。SNNS用户手册说明了在人工神经网络(如,连接模型)中,“信息通常分布在整个网络并被储存在拓扑结构和链接的权重中。网络由(自动化的)训练方法来组织,其大大地简化了专用应用的开发。在普通[人工智能]AI系统中的经典逻辑被模糊结论和联想回忆(完全匹配对最优匹配)所取代。在不能给出清楚的逻辑规则集合的所有情况中,这是很大的优点。连接模型的固有的容错是另一个优点。另外,可使神经网络变得能够容忍输入中的噪声:当噪声增加时,输出的品质常常仅缓慢地降低(微小的性能损失)。尽管存在用于神经网络的模拟器,但是它们在学术界/大学之外的实际应用是被限制的,尤其是在服务器能力规划领域。公开概述为了提供对一些方面的基本理解,以下给出了本公开的简化的概述。其并不旨在确定本公开的关键或重要的要素或描绘本公开的范围。以下的概述仅仅将本公开的一些概念以简化的形式给出,作为下面提供的更详细的描述的序言。本公开描述了用于管理在变化的负载下的一个或多个服务器的能力的方法和系统。说明性的系统可包括储存了负载和健康测量结果的数据储存器、一个或多个处理器、以及储存了各种模块的存储器,当各种模块被处理器执行时,导致对多个服务器机器的能力的管理。神经网络可用于接受对应的负载和健康测量结果作为输入,并使用学习模块计算这些输入之间的关系(如,相关性、因果关系等)。另外,预测器模块可使用神经网络生成多个服务器机器的预测的健康状况。另外,模拟器模块可根据本公开的各个方面被用于进一步增强神经网络的更新和服务器能力的管理。在根据本公开的方面的另一个实施方案中,包括计算机处理器和储存了计算机可执行指令的有形的、非暂时性的计算机存储器的装置被公开,当计算机可执行指令被处理器执行时,促使计算机系统实施本文描述的一个或多个步骤。在可选的实施方案中,计算机存储器可被整体或部分地放置在数据储存器系统中。本公开的这些和其它实施方案的细节将在附图和下面的描述中阐述。本公开的其它特征和优点根据描述和附图将变得明显。当然,上面参考的实施方案的方法和系统还可包括其它附加元件、步骤、计算机可执行指令或计算机可读数据结构。根据本公开的实施方式还描述了以下方面:1)一种系统,包括:多个服务器机器,每一个服务器机器包括至少一个计算机处理器、一个或多个计算机存储器及输入输出总线;数据储存器,其储存所述多个服务器机器的对应的负载测量结果和健康测量结果;神经网络,其被配置为接收所述对应的负载测量结果和健康测量结果作为输入;储存了学习模块的计算设备的存储器,当所述学习模块被所述计算设备的处理器执行时,导致使用所述多个服务器机器的对应的负载测量结果和健康测量结果的输入对所述神经网络进行更新;储存了预测器模块的所述计算设备的所述存储器,当所述预测器模块被所述计算设备的所述处理器执行时,给定假设的增加的负载值,所述预测器模块使用被更新的神经网络生成所述多个服务器机器的预测健康值,其中,所述预测健康值包括置信度分数;以及储存了模拟器模块的所述计算设备的所述存储器,当所述模拟器模块被所述计算设备的所述处理器执行时,所述模拟器模块依据假设的增加的负载值生成所述多个服务器机器上的模拟的负载。2)如项目1)所述的系统,其中,所述负载测量结果包括处理器利用率测量结果、存储器使用测量结果和输入输出吞吐率测量结果。3)如项目1)所述的系统,其中,所述健康测量结果包括下列中的至少一个:应用启动时间和对用户请求的响应时间。4)如项目1)所述的系统,其中,当所述系统上的负载处于第一值时,所述预测健康值指示线性响应,而当所述系统上的负载处于大于所述第一值的第二值时,所述预测健康值指示非线性响应。5)如项目1)所述的系统,其中,所述学习模块训练所述神经网络来将所述多个服务器机器的负载测量结果与所述多个机器的对应的健康测量结果相关联,包括将在所述数据储存器中储存的历史负载测量结果和对应的健康测量结果相关联。6)如项目1)所述的系统,其中,所述计算设备包括与所述多个服务器机器通信的负载均衡器设备。7)如项目6)所述的系统,还包括:储存了资源供应模块的所述负载均衡器设备的存储器,在所述资源供应模块被负载均衡器设备的处理器执行时,当所述预测健康值显示在所述多个服务器机器中的非线性响应时,导致附加资源被添加至所述多个服务器机器。8)如项目1)所述的系统,还包括:储存了资源供应模块的所述计算设备的所述存储器,在所述资源供应模块被所述计算设备的所述处理器执行时,当所述预测健康值显示所述多个服务器机器中的非线性响应时,导致附加服务器被添加至所述多个服务器机器。9)如项目1)所述的系统,其中,所述模拟器模块包括计算机可执行指令,当所述计算机可执行指令被所述计算设备的所述处理器执行时,还导致所述系统执行以下操作:确定所述预测健康值的所述置信度分数是否高于门限置信度值;如果所述置信度分数不高于所述门限置信度值,则依据增量负载本文档来自技高网...
管理计算机服务器能力

【技术保护点】
一种系统,包括:多个服务器机器,每一个服务器机器包括至少一个计算机处理器、一个或多个计算机存储器及输入输出总线;数据储存器,其储存所述多个服务器机器对应的负载测量结果和健康测量结果;神经网络,其被配置为接收所述对应的负载测量结果和健康测量结果作为输入;储存了学习模块的计算设备的存储器,当所述学习模块被所述计算设备的处理器执行时,导致使用所述多个服务器机器的对应的负载测量结果和健康测量结果的输入对所述神经网络进行更新;储存了预测器模块的所述计算设备的所述存储器,当所述预测器模块被所述计算设备的所述处理器执行时,给定假设的增加的负载值,所述预测器模块使用被更新的神经网络生成所述多个服务器机器的预测健康值,其中,所述预测健康值包括置信度分数;以及储存了模拟器模块的所述计算设备的所述存储器,当所述模拟器模块被所述计算设备的所述处理器执行时,所述模拟器模块依据假设的增加的负载值生成所述多个服务器机器上的模拟的负载。

【技术特征摘要】
【国外来华专利技术】2013.03.15 US 13/835,2941.一种管理计算机服务器能力的系统,包括:多个服务器机器,每一个服务器机器包括至少一个计算机处理器、一个或多个计算机存储器及输入输出总线;数据储存器,其储存所述多个服务器机器的对应的负载测量结果和健康测量结果;神经网络,其被配置为接收所述对应的负载测量结果和健康测量结果作为输入;储存了学习模块的计算设备的存储器,当所述学习模块被所述计算设备的处理器执行时,导致使用所述多个服务器机器的对应的负载测量结果和健康测量结果的输入对所述神经网络进行更新;储存了预测器模块的所述计算设备的所述存储器,当所述预测器模块被所述计算设备的所述处理器执行时,给定假设的增加的负载值,所述预测器模块使用被更新的神经网络生成所述多个服务器机器的预测健康值,其中,所述预测健康值包括置信度分数,其中,当所述系统上的负载处于第一值时,所述预测健康值指示线性响应,而当所述系统上的所述负载处于大于所述第一值的第二值时,所述预测健康值指示非线性响应;以及储存了模拟器模块的所述计算设备的所述存储器,当所述模拟器模块被所述计算设备的所述处理器执行时,所述模拟器模块依据假设的增加的负载值生成所述多个服务器机器上的模拟的负载。2.如权利要求1所述的系统,其中,所述负载测量结果包括处理器利用率测量结果、存储器使用测量结果和输入输出吞吐率测量结果。3.如权利要求1所述的系统,其中,所述健康测量结果包括下列中的至少一个:应用启动时间和对用户请求的响应时间。4.如权利要求1所述的系统,其中,所述学习模块训练所述神经网络来将所述多个服务器机器的所述负载测量结果与所述多个服务器机器的对应的健康测量结果相关联,包括将在所述数据储存器中储存的历史负载测量结果和对应的健康测量结果相关联。5.如权利要求1所述的系统,其中,所述计算设备包括与所述多个服务器机器通信的负载均衡器设备。6.如权利要求5所述的系统,还包括:储存了资源供应模块的所述负载均衡器设备的存储器,在所述资源供应模块被负载均衡器设备的处理器执行时,当所述预测健康值显示所述多个服务器机器中的非线性响应时,导致附加资源被添加至所述多个服务器机器。7.如权利要求1所述的系统,还包括:储存了资源供应模块的所述计算设备的所述存储器,在所述资源供应模块被所述计算设备的所述处理器执行时,当所述预测健康值显示所述多个服务器机器中的非线性响应时,导致附加服务器机器被添加至所述多个服务器机器。8.如权利要求1所述的系统,其中,所述模拟器模块在被所述计算设备的所述处理器执行时,还导致所述系统执行以下操作:确定所述预测健康值的所述置信度分数是否高于门限置信度值;如果所述置信度分数不高于所述门限置信度值,则依据增量负载值执行模拟的负载;否则如果所述置信度分数高于所述门限置信度值,则确定所述预测健康值是否是所述系统中的非线性响应的结果;如果所述预测健康值是所述系统中的非线性响应的结果,则请求附加资源用于所述多个服务器机器;以及如果所述预测健康值高于最大的门限值,则请求附加资源用于所述多个服务器机器。9.一种管理计算机服务器能力的装置,包括:用于接收对应于至少一个服务器机器的健康的最小值的模块;用于监测计算机系统的健康和所述至少一个服务器机器上的负载的模块;用于储存负载测量结果和健康测量结果的数据储存器;用于将所述负载测量结果和所述健康测量结果提供给包括神经网络的学习模块的模块,其中,使用所述负载测量结果和...

【专利技术属性】
技术研发人员:托马斯·波尔特吉斯威廉·德福雷斯特
申请(专利权)人:思杰系统有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1