一种基于关联分析的监控数据智能采样方法技术

技术编号：16152750 阅读：60 留言：0更新日期：2017-09-06 18:13

本发明专利技术公开了一种基于关联分析的监控数据智能采样方法，包括四个关键步骤：时序数据编码、关联关系挖掘、计算状态转移矩阵、状态预测。本发明专利技术方法可以根据对未来主机资源利用率的预测，动态地调整监控周期，达到在资源利用率变化平稳时减小采样频率，在资源利用率变化剧烈时增大采样频率以节约计算及存储资源的目的。与现有技术相比，本发明专利技术方法可以在机器平稳运行，增大监控周期，减小采样率；机器运行出现波动时，需要减小监控周期，增大采样率；这样获得的更多是有意义的监控数据，有效地减少无用数据的采集，防止浪费大部分计算资源在无用数据的采集和计算等处理上，提高效率，并在减少无用数据采集的同时，保持高准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于关联分析的监控数据智能采样方法
本专利技术属于智能采样
，具体涉及一种基于关联分析的监控数据智能采样方法。
技术介绍
随着云计算和移动互联网的进一步普及和深入应用，各类网络应用和服务正在各行各业中扮演着更为重要的角色。有些网络服务对于负载的波动有着敏感的变化，合理设计的采样率算法可以保障宿主机中网络等资源利用的低开销，同时使得监控系统后端的计算资源尤其是存储资源的压力减小，以及对于关键信息不丢失，因此是系统性能优化方向的一个关键的问题，其效率的好坏直接影响着系统优化的效率。目前采样的方式大致分为三类，即固定周期采样、可变周期采样和动态周期采样。固定周期采样最好理解，即采样的频率是一个固定的周期，一般写在配置文件中。传统的Nagios和Ganglia以及GoogleDapper就是如此。这类采样率策略优点就是实现简单，易于操作，但是如果需要修改监控周期，往往需要更改配置文件后重启系统。可变周期采样在固定周期采样的基础上实现了系统采样周期的热更新，即修改采样周期可以在系统运行时进行热更新，而不需要重启系统，往往通过向系统发送外部命令的方式实现。优点自然是可以在系统运行时修改采样周期，缺点是采样周期的设置和修改往往需要系统管理员判断，准确率和效率都不高。动态周期采样相比于可变周期采样再次发展而来，使得系统自身根据监控对象的运行状态自动调整采样周期，达到解决系统计算及存储资源的目的。而动态调整采样周期的算法往往基于预测，在系统运行状态平稳时，增大采样周期，减小采样率；系统运行波动时，减小采样周期，增大采样率。从而实现采集更多的有效数据，摒弃更多的无用...
一种基于关联分析的监控数据智能采样方法

【技术保护点】
一种基于关联分析的监控数据智能采样方法，包括如下步骤：(1)对节点的监控数据进行归一化，并对归一化后的监控数据进行波动率标记，得到节点的波动率字符流；(2)对同一数据中心内任一对节点组合的波动率字符流进行错位拟合标记，得到该对节点组合的错位拟合码；(3)统计所述错位拟合码中每一模式的支持度，取支持度大于设定阈值的模式作为频繁模式，进而利用Apriori算法计算每一频繁模式的置信度；所述模式为错位拟合码中两个及两个以上连续的编码；(4)根据步骤(2)和(3)遍历所有节点组合；对于任一节点，根据其波动率字符流并综合马尔科夫链和频繁模式置信度，预测其下一时刻的波动状态，进而动态调整该节点的监控采样周期。

【技术特征摘要】
1.一种基于关联分析的监控数据智能采样方法，包括如下步骤：(1)对节点的监控数据进行归一化，并对归一化后的监控数据进行波动率标记，得到节点的波动率字符流；(2)对同一数据中心内任一对节点组合的波动率字符流进行错位拟合标记，得到该对节点组合的错位拟合码；(3)统计所述错位拟合码中每一模式的支持度，取支持度大于设定阈值的模式作为频繁模式，进而利用Apriori算法计算每一频繁模式的置信度；所述模式为错位拟合码中两个及两个以上连续的编码；(4)根据步骤(2)和(3)遍历所有节点组合；对于任一节点，根据其波动率字符流并综合马尔科夫链和频繁模式置信度，预测其下一时刻的波动状态，进而动态调整该节点的监控采样周期。2.根据权利要求1所述的监控数据智能采样方法，其特征在于：所述步骤(1)中根据以下关系式对归一化后的监控数据进行波动率标记：其中：Vi和Vi-1分别为归一化后监控数据中当前时刻和前一时刻的采样值，Si为归一化后监控数据中当前时刻采样点的波动率字符，Threshold为设定的阈值，R、L、F对应表示高、中、低三种波动状态。3.根据权利要求2所述的监控数据智能采样方法，其特征在于：所述步骤(2)中的错位拟合标记方法为：使两个节点的波动率字符流错开一位形成对应关系，对于前后两个单独错位的波动率字符标记为X，对于中间两两对应的波动率字符根据以下标准进行标记，从而得到错位拟合码；波动率字符R与R，则标记为0；波动率字符R与L，则标记为1；波动率字符R与F，则标记为2...

【专利技术属性】
技术研发人员：尹建伟，吴昊，邓水光，李莹，吴健，吴朝晖，易峥，
申请(专利权)人：浙江大学，浙江核新同花顺网络信息股份有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人