当前位置: 首页 > 专利查询>伊姆西公司专利>正文

用于确定存储系统性能下降的原因的方法和设备技术方案

技术编号:15746493 阅读:73 留言:0更新日期:2017-07-03 01:55
本公开的实施例提供了一种用于确定存储系统的性能下降原因的方法和设备。该方法包括:根据预定的策略对存储系统的性能进行监控;针对监控的结果,基于系统性能基线来生成对应的性能下降事件;响应于性能下降事件,获得与性能下降有关的信息;以及对该信息进行离线分析,以确定性能下降的原因。与现有技术相比,本公开的实施例能够有效地对系统性能下降进行持续的管理,使得运行开销最小化,并且经由插入的方式能够支持现有的性能分析工具。

Method and apparatus for determining reasons for performance degradation of a storage system

Embodiments of the present disclosure provide a method and apparatus for determining the reasons for a performance degradation of a storage system. The method includes: according to the predetermined performance monitoring strategy for storage system; according to the monitoring results, performance decline to generate corresponding system performance based on the baseline event; in response to declining performance events, dropped to relevant information and performance; and analyzes the information off-line to determine the cause of performance degradation. Compared with the prior art, the disclosed embodiments can carry out continuous management on system performance effectively, make the operation cost minimization, and through the insertion mode to support existing performance analysis tools.

【技术实现步骤摘要】
用于确定存储系统性能下降的原因的方法和设备
本公开的实施例总体涉及系统性能,具体涉及一种用于确定存储系统性能下降的原因的方法和设备。
技术介绍
对复杂系统尤其是生产系统的性能下降的原因进行定位是相当困难和耗费时间的。尽管一致的性能通常是系统设计目标之一,但是几乎每个系统在实践中都会遭受意想不到的性能下降,尤其是那些利用许多组件、层或复杂逻辑而构建的系统。例如,系统性能下降的原因通常包括:设计和/或实现上的缺陷或限制、软件配置问题和/或硬件限制。设计和/或实现上的缺陷或限制可以是关于特定组件,诸如锁定或者关键I/O路径上的串行化;或者更普遍地可以是若干组件间的意想不到的交互,例如资源冲突或者有限的可扩展性等。例如,典型的企业级存储系统包括协议、缓存、数据压缩、自动精简配置、快照和越来越多的后台服务。任何单个组件或者组件间的交互可能影响用户可见的性能。软件配置问题诸如块大小、缓存大小或者队列大小等。硬件限制例如包括,特定硬件组件(如网络接口卡端口、中央处理单元(CPU)或磁盘)到达其性能上限并且变为系统的瓶颈,使得系统的端到端的性能无法持续等。目前确定系统性能下降的原因通常是长期的、事后的过程,该过程通常需要通过人工进行资料搜集并搭建模拟环境以对问题进行重现。由于不能够在性能下降时立即捕获性能表现以及缺乏协调,上述过程通常是人工的、反复迭代的过程,导致低效、不确定的准确性和高昂的成本。因此,本领域中需要一种更准确和高效的方法来解决上述问题。
技术实现思路
本公开的实施例旨在提供一种用于确定存储系统性能下降的原因的方法和设备。根据本公开的第一方面,提供了一种用于确定存储系统的性能下降原因的方法。该方法包括:根据预定的策略对存储系统的性能进行监控;针对监控的结果,基于系统性能基线来生成对应的性能下降事件;响应于性能下降事件,获得与性能下降有关的信息;以及对该信息进行离线分析,以确定性能下降的原因。在一些实施例中,根据预定的策略对存储系统的性能进行监控包括:基于预定的监控目标,对监控目标的性能指标进行监控,以获得监控目标的原始性能数据;并且针对监控的结果,基于系统性能基线来生成对应的性能下降事件包括:将原始性能数据与最新的系统性能基线进行比较;以及基于比较的结果来生成性能下降事件。在一些实施例中,基于比较的结果来生成性能下降事件包括:在原始性能数据低于最新的系统性能基线时,生成性能下降事件。在一些实施例中,该方法还包括:利用四元组来标记性能下降事件。其中该四元组包括:最近的性能统计、性能下降的指示、性能下降的程度以及达到该程度的次数。在一些实施例中,该方法还包括:检测存储系统的正常性能,以生成经检测的系统性能基线;以及基于经检测的系统性能基线,生成最新的系统性能基线。在一些实施例中,检测存储系统的正常性能包括:周期性地检测存储系统的正常性能;或者响应于存储系统的配置改变,检测存储系统的正常性能。其中配置改变包括以下的至少一种:硬件改变、工作负载改变、存储系统的启动以及文件系统挂载。在一些实施例中,基于经检测的系统性能基线,生成最新的系统性能基线包括:基于当前的系统性能基线和经检测的系统性能基线,以加权的方式生成最新的系统性能基线。在一些实施例中,响应于性能下降事件,获得与性能下降有关的信息包括:基于性能下降的程度,来执行第一类动作。其中第一类动作包括以下的至少一种:针对特定层和特定目标的分析;针对特定目标,对多个层的垂直分析;以及针对特定层,对多个目标的水平分析。在一些实施例中,响应于性能下降事件,获得与性能下降有关的信息还包括:对存储系统的资源使用情况进行监控;基于资源使用情况,执行第二类动作;以及执行第一类动作,以获得与性能下降有关的信息。其中第二类动作包括以下的至少一种:根据资源使用情况,对使用相应资源的对象进行排名;以及限制具有较高排名的特定对象对特定资源的使用。在一些实施例中,第一类动作由以下的至少一个实体来执行:系统内置的性能分析工具;插入式的性能分析工具;以及来自第三方的性能分析工具。在一些实施例中,与性能下降有关的信息包括以下的一项或多项:相关的事件信息、系统跟踪信息、最近的性能统计信息和相关的系统配置信息。根据本公开的第二方面,提供了一种用于确定存储系统的性能下降原因的设备,包括:性能监控装置,被配置为根据预定的策略对存储系统的性能进行监控;下降检测装置,被配置为针对监控的结果,基于系统性能基线来生成对应的性能下降事件;性能分析装置,被配置为响应于性能下降事件,获得与性能下降有关的信息;以及原因确定装置,被配置为对该信息进行离线分析,以确定性能下降的原因。在一些实施例中,性能监控装备被配置为:基于预定的监控目标,对监控目标的性能指标进行监控,以获得监控目标的原始性能数据;并且下降检测装置被配置为:将原始性能数据与最新的系统性能基线进行比较;以及基于比较的结果来生成性能下降事件。在一些实施例中,基于比较的结果来生成性能下降事件包括:在原始性能数据低于最新的系统性能基线时,生成性能下降事件。在一些实施例中,该设备还包括:事件标记装置,被配置为利用四元组来标记性能下降事件。其中该四元组包括:最近的性能统计、性能下降的指示、性能下降的程度以及达到该程度的次数。在一些实施例中,该设备还包括:基线检测装置,被配置为检测存储系统的正常性能,以生成经检测的系统性能基线;以及基线生成装置,被配置为基于经检测的系统性能基线,生成最新的系统性能基线。在一些实施例中,基线检测装置被配置为:周期性地检测存储系统的正常性能;或者响应于存储系统的配置改变,检测存储系统的正常性能。其中配置改变包括以下的至少一种:硬件改变、工作负载改变、存储系统的启动以及文件系统挂载。在一些实施例中,基线生成装置被配置为:基于当前的系统性能基线和经检测的系统性能基线,以加权的方式生成最新的系统性能基线。在一些实施例中,性能分析装置被配置为:基于性能下降的程度,来执行第一类动作。其中第一类动作包括以下的至少一种:针对特定层和特定目标的分析;针对特定目标,对多个层的垂直分析;以及针对特定层,对多个目标的水平分析。在一些实施例中,性能分析装置还被配置为:对存储系统的资源使用情况进行监控;基于资源使用情况,执行第二类动作;以及执行第一类动作,以获得与性能下降有关的信息。其中第二类动作包括以下的至少一种:根据资源使用情况,对使用相应资源的对象进行排名;以及限制具有较高排名的特定对象对特定资源的使用。在一些实施例中,第一类动作由以下的至少一个实体来执行:系统内置的性能分析工具;插入式的性能分析工具;以及来自第三方的性能分析工具。在一些实施例中,与性能下降有关的信息包括以下的一项或多项:相关的事件信息、系统跟踪信息、最近的性能统计信息和相关的系统配置信息。根据本公开的第三方面,提供了一种用于确定存储系统性能下降的原因的计算机程序产品,该计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,该计算机可执行指令在被执行时使得计算机执行方法的任意步骤。与现有技术相比,根据本公开的实施例的用于确定存储系统性能下降的原因的方法和设备,能够有效地对系统性能下降进行持续的管理,使得运行开销最小化,并且经由插入的方式本文档来自技高网...
用于确定存储系统性能下降的原因的方法和设备

【技术保护点】
一种用于确定存储系统的性能下降原因的方法,包括:根据预定的策略对所述存储系统的性能进行监控;针对所述监控的结果,基于系统性能基线来生成对应的性能下降事件;响应于所述性能下降事件,获得与所述性能下降有关的信息;以及对所述信息进行离线分析,以确定所述性能下降的原因。

【技术特征摘要】
1.一种用于确定存储系统的性能下降原因的方法,包括:根据预定的策略对所述存储系统的性能进行监控;针对所述监控的结果,基于系统性能基线来生成对应的性能下降事件;响应于所述性能下降事件,获得与所述性能下降有关的信息;以及对所述信息进行离线分析,以确定所述性能下降的原因。2.根据权利要求1所述的方法,其中根据预定的策略对所述存储系统的性能进行监控包括:基于预定的监控目标,对所述监控目标的性能指标进行监控,以获得所述监控目标的原始性能数据;并且其中针对监控的结果,基于系统性能基线来生成对应的性能下降事件包括:将所述原始性能数据与最新的系统性能基线进行比较;以及基于所述比较的结果来生成所述性能下降事件。3.根据权利要求2所述的方法,其中基于所述比较的结果来生成所述性能下降事件包括:在所述原始性能数据低于所述最新的系统性能基线时,生成所述性能下降事件。4.根据权利要求2所述的方法,还包括:利用四元组来标记所述性能下降事件,其中所述四元组包括:最近的性能统计、性能下降的指示、性能下降的程度以及达到所述程度的次数。5.根据权利要求2所述的方法,还包括:检测所述存储系统的正常性能,以生成经检测的系统性能基线;以及基于所述经检测的系统性能基线,生成所述最新的系统性能基线。6.根据权利要求5所述的方法,其中检测所述存储系统的正常性能包括:周期性地检测所述存储系统的正常性能;或者响应于所述存储系统的配置改变,检测所述存储系统的正常性能,其中所述配置改变包括以下的至少一种:硬件改变、工作负载改变、所述存储系统的启动以及文件系统挂载。7.根据权利要求5所述的方法,其中基于所述经检测的系统性能基线,生成所述最新的系统性能基线包括:基于当前的系统性能基线和所述经检测的系统性能基线,以加权的方式生成所述最新的系统性能基线。8.根据权利要求1所述的方法,其中响应于所述性能下降事件,获得与所述性能下降有关的信息包括:基于所述性能下降的程度,来执行第一类动作,其中所述第一类动作包括以下的至少一种:针对特定层和特定目标的分析;针对特定目标,对多个层的垂直分析;以及针对特定层,对多个目标的水平分析。9.根据权利要求8所述的方法,其中响应于所述性能下降事件,获得与所述性能下降有关的信息还包括:对所述存储系统的资源使用情况进行监控;基于所述资源使用情况,执行第二类动作;以及执行所述第一类动作,以获得与所述性能下降有关的信息,其中所述第二类动作包括以下的至少一种:根据所述资源使用情况,对使用相应资源的对象进行排名;以及限制具有较高排名的特定对象对特定资源的使用。10.根据权利要求8所述的方法,其中所述第一类动作由以下的至少一个实体来执行:系统内置的性能分析工具;插入式的性能分析工具;以及来自第三方的性能分析工具。11.根据权利要求1所述的方法,其中与所述性能下降有关的信息包括以下的一项或多项:相关的事件信息、系统跟踪信息、最近的性能统计信息和相关的系统配置信息。12.一种...

【专利技术属性】
技术研发人员:赵军平曹逾李三平
申请(专利权)人:伊姆西公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1