一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法技术

技术编号:23764002 阅读:23 留言:0更新日期:2020-04-11 18:52
本发明专利技术公开了一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法,研究基于隐马尔科夫随机场HMRF的SaaS软件性能问题识别模型,利用HMRF构建性能问题的最大后验概率MAP估计模型;建立MAP估计和HNN能量的关系,并提供一个更新规则以保证收敛;设计基于期望最大EM的算法获得估计模型的最优参数,基于观察数据在EM框架中递归估计模型参数。本发明专利技术的有益效果在于:系统开销小,能够准确识别出性能问题,确实能够协助运维管理人员恢复SaaS软件的服务能力。

A method of SaaS software performance problem identification based on Hidden Markov random field

【技术实现步骤摘要】
一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法
本专利技术属于性能分析
,具体涉及针对面向服务软件运行时产生的性能问题提出了一种基于隐马尔科夫随机场(HMRF)的识别方法。
技术介绍
SaaS软件将软件以服务的方式提供给用户使用,服务质量(QoS)无疑是决定用户满意度的决定性因素。性能作为SaaS软件的一种重要服务质量属性,直接影响了用户的体验。在云计算所提供的可动态伸缩的运行环境中,如果SaaS软件响应各种服务请求,特别是响应来自租户的服务请求的平均时间过长,软件服务没有满足服务水平目标(ServiceLevelObjective,SLO),并丧失可用性时,可称服务出现了性能问题。当服务出现性能问题时,往往会引发用户不满,严重者会造成用户流失,使得服务商的业务受损。因此,在SaaS软件运行过程中,需要运维管理人员能及时、无遗漏、准确地发现性能问题,并找到其出现的原因,以采取相应的措施保障系统能够及时将失效服务还原到可用状态,并持续提供高性能的服务。这种情况下,通过相应的设施不间断地监控并实时地识别与诊断性能问题,成为实现这种需求的必要条件。SaaS软件的运行日志是在软件运行时,记录软件自身及其运行支撑环境的状态、事件、过程或变化踪迹,记录用户的使用行为、发生的事件、交互的消息等方面信息的数据。软件运行日志被广泛应用于软件系统管理的各种任务,如软件失效分析、环境分析、用户使用行为分析等。而当SaaS软件出现性能问题时,被日志记录着的性能状态信息常常是能够用于分析问题根本原因的重要手段。<br>然而,利用运行日志识别SaaS软件性能问题,仍然面临着挑战:(1)SaaS软件及其环境记录的日志中,用于识别性能问题的信息严重不足。SaaS软件性能问题可能来源于软件本身的缺陷,也可能来源于运行环境的资源不足,还可能来源于用户的爆炸性的突发请求,甚至来源于软件所依赖的第三方服务。为了识别性能问题,需要获取软件和环境各方面信息来综合判断。目前,真实的软件环境中能够提供的信息常常会有欠缺,影响了性能问题识别的及时性和准确性。(2)现有的性能问题分析方法在及时性和准确性方面常常难以达到SaaS软件的要求。传统的基于日志进行性能问题识别和诊断的方法,一般是依靠运维管理人员从大量且复杂的日志中抽出与性能问题相关的信息,根据经验对相关日志进行分析,发现系统的运行瓶颈,并对性能问题进行检测、诊断、定位。然而,由于SaaS软件部署在云平台环境里,各层次间的应用软件或服务交互频繁,从而导致系统中各个组件产生海量的日志数据,并且很多是充斥着噪音的多维数据,这不仅加大了传统方式对SaaS软件性能问题进行识别的难度,而且降低了识别的及时性和准确性。为解决上述问题,本专利技术将针对SaaS软件及其所处云计算环境的特点,结合对性能问题进行识别和诊断的特定需求,研究一种基于运行日志分析以自动识别SaaS软件性能问题的方法。该方法是面向运维管理人员的黑盒式在线性能分析方法,它不需要了解系统代码、结构和开发情况,就能对运行性能进行管理,及时发现并诊断性能问题,持续保障SaaS软件的服务质量。
技术实现思路
本专利技术的目的在于提供一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法,本专利技术以面向服务的SaaS软件为研究目标,构建了SaaS软件性能问题识别模型,将HMRF算法引入面向服务的软件性能问题识别问题之中,具体内容包括:1)研究基于隐马尔科夫随机场HMRF的SaaS软件性能问题识别(二分类)模型,利用HMRF构建性能问题的最大后验概率MAP估计模型;2)研究SaaS软件性能问题识别模型的智能求解算法,考虑使用Hopfield神经网络HNN获得MAP估计,建立MAP估计和HNN能量的关系,并提供一个更新规则以保证收敛;3)设计基于期望最大EM的算法获得估计模型的最优参数,基于观察数据在EM框架中递归估计模型参数。基于上述过程,实现性能问题识别算法,对系统当前的状态做出判断,以达到帮助运维管理人员及时准确地发现性能问题的目的。本专利技术的有益效果在于:提出的方法1)系统开销小,2)能够准确识别出性能问题,3)确实能够协助运维管理人员恢复SaaS软件的服务能力,4)对比其它方法,能够更好地识别系统的性能问题。为实现本专利技术所述目的采用的技术方案是:基于隐马尔科夫随机场的SaaS软件性能问题识别方法,包括以下步骤:步骤1:SaaS软件性能问题识别问题形式化使St={0,1}表示系统t时刻的SLO({compliance,violation})性能状态,表示t时刻n个收集的性能指标向量,其中,mi是第i个指标。在SaaS软件复杂的运行环境下,软件出现性能问题往往是不可观测的,但是可以通过系统特征参数(低级指标,比如CPU、内存)来推断当前系统的性能状态。这和隐马尔科夫模型(HiddenMarkovModel,HMM)的隐藏状态一致,将系统的SLO状态S={0,1}可以表示为HMM的隐藏状态。此外,为了合理地推断隐藏状态,有必要分析其引起的可观测系统特征参数的变化,将系统的可观测变量可以表示为HMM的可观测参数。步骤2:针对第1步对SaaS软件性能问题识别问题的形式化,设计基于隐马尔科夫随机场的SaaS软件性能问题识别方法HMRF-PII(1)通过HMRF构建MAP估计模型。利用HMRF构建MAP估计模型的过程如下:1)定义先验势函数以得到L表示的HMRF模型,根据Hammersley-Clifford定理,的先验概率可以表示为Gibbs分布其中,Z2是正态常数,表示总体势函数,是所有邻域系统上势的总和,是标签配置在邻域系统上的势函数。每个邻域系统内的每一对相邻记录倾向于分到同一个性能问题类簇。由此,可以定义为其中,变量表示指示函数wp为邻域系统中总邻域约束违反的正态权重,对于没有分到同一类簇的相邻记录给予更多的权重。2)导出似然概率函数似然函数建模可观测随机场的条件独立性,具有Gaussian分布每个类可以由其均值向量μl和方差表示。根据HMRF模型的特征,χ的条件概率可以表示为在公式(3)中,分别表示性能问题类和正常类的方差。同样地,μl∈{μv,μc}分别表示性能问题类和正常类的均值。这里,考虑把作为和概率密度函数(ProbabilityDensityFunction,PDF)相关联的参数向量。3)和相乘,得到后验概率不能确定地从x获得,而是估计得到。一种估计的方式是,基于统计的MAP准则。这种情况的目标是,有一个估计规则产生使下面的后验概率分布最大。考虑HMRF的先验概率(1)和条件概率(3),可以从公式(4)推导出其中,是常数。通过最小化公式(5),优化并得到(2)通过HNN获得MAP估计。把性能问题识别问题看作MAP估计问题,利用Hopfield神经网络(HopfieldNeuralNetwork,HNN)对其进行求解,只需建立公式(5)与H本文档来自技高网
...

【技术保护点】
1.一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法,其特征在于按照以下步骤进行:/n步骤1:SaaS软件性能问题识别问题形式化/n使S

【技术特征摘要】
1.一种基于隐马尔科夫随机场的SaaS软件性能问题识别方法,其特征在于按照以下步骤进行:
步骤1:SaaS软件性能问题识别问题形式化
使St={0,1}表示系统t时刻的SLO性能状态,

表示t时刻n个收集的性能指标向量,其中,mi是第i个指标,将系统的SLO状态S={0,1}表示为HMM的隐藏状态,将系统的可观测变量表示为HMM的可观测参数;
步骤2:设计基于隐马尔科夫随机场的SaaS软件性能问题识别方法HMRF-PII
(1)通过HMRF构建MAP估计模型;
利用HMRF构建MAP估计模型的过程如下:
1)定义先验势函数以得到
L表示的HMRF模型,的先验概率表示为Gibbs分布



其中,Z2是正态常数,表示总体势函数,是所有邻域系统上势的总和,是标签配置在邻域系统上的势函数,每个邻域系统内的每一对相邻记录倾向于分到同一个性能问题类簇;由此,定义为



其中,变量表示指示函数wp为邻域系统中总邻域约束违反的正态权重;
2)导出似然概率函数
似然函数建模可观测随机场的条件独立性,具有Gaussian分布每个类由其均值向量μl和方差表示,根据HMRF模型的特征,χ的条件概率表示为



在公式(3)中,表示性能问题类和正常类的方差,μl∈{μv,μc}表示性能问题类和正常类的均值,这里,考虑把作为和概率密度函数ProbabilityDensityFunction,PDF相关联的参数向量;
3)和相乘,得到后验概率

不能确定地从x获得,而是估计得到,一种估计的方式是,基于统计的MAP准则,这种情况的目标是,有一个估计规则产生使下面的后验概率分布



最大。考虑HMRF的先验概率(1)和条件概率(3),可以从公式(4)推导出






其中,是常数,通过最小化公式(5),优化并得到
(2)通过HNN获得MAP估计
把性能问题识别问题看作MAP估计问题,利用Hopfield神经网络HopfieldNeuralNetwork,HNN对其进行求解,只需建立公式(5)与HNN能量之间的关系,并提供更新规则以保证收敛,把公式(5)中的团势函数视为



其中,和分别表示第s个和第q个神经元的输出,是它们之间的连接权重,取决于连接强度的取值为



其中,wp是和团势函数关联的参数,也是HMR...

【专利技术属性】
技术研发人员:王蕊应时石永奎贾顺孙承爱李美燕
申请(专利权)人:山东科技大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1