一种提高云平台监控性能及规模的监控方法技术

技术编号:14834227 阅读:103 留言:0更新日期:2017-03-16 20:39
本发明专利技术涉及云计算管理技术领域,特别是指一种提高云平台监控性能及规模的监控方法。本发明专利技术的方法是在一个监控频率周期内,将单批次的监控数据采集任务分多个批次进行;实现错位监控。本发明专利技术方法运维简单灵活,无需采用分布式部署结构,充分利用现有的监控周期将大规模监控采集实现错位采集。

【技术实现步骤摘要】

本专利技术涉及云计算管理
,特别是指一种提高云平台监控性能及规模的监控方法
技术介绍
随着云计算的发展,单个云平台的规模在逐渐的扩大,为了便于管理和运维,通常都会开发针对虚拟机的各项资源进行监控,比如CPU利用率、内存利用率、IO利用率等各项资源使用监控项。云平台会将每次的监控数据记录到数据库或者文件服务器以方便运维人员查阅,这些历史监控数据通常都能够让运维人员及时发现虚拟机的异常情况。但是随着虚拟机数量的增加,历史监控数据呈现爆发时的增长,特别是监控频率设置的比较高的时候,比如当云平台规模达到1万台,监控频率5s一次,每台虚拟机监控指标5项时,一分钟将产生60万条数据,一天就采集86400万条数据,而数据库及服务器能够承受的并发采集数量是有限的。目前一般采用分布式部署或者提高硬件配置的方式来解决并发采集的问题,这种方式往往会消耗大量的成本和运维复杂度。
技术实现思路
本专利技术解决的技术问题在于提供一种提高云平台监控性能及规模的监控方法,解决现在监控方法的不足,为云计算环境下虚拟机各项监控指标提供一种在保证监控数据不受影响,又不增加成本的情况下提高云平台监控性能及规模的解决方案。本专利技术解决上述技术问题的技术方案是,所述方法的方法是在一个监控频率周期内,将单批次的监控数据采集任务分多个批次进行;实现错位监控。所述的方法具体包括如下步骤:步骤1:设置错位监控值,错位监控值的两倍小于监控频率;步骤2:根据错位监控值与监控频率,计算在同个监控频率内所要分批采集的次数n;步骤3:将每台计算节点的虚拟机按照批次分组,分组策略为计算节点虚拟机数量除以批次后,按照预先设定进行分组并顺序编号;步骤4:选取每个计算节点编号一样的虚拟机组合,形成错位监控对象集合,编号不变;步骤5:根据计算的监控批次n,在同一个监测周期内,完成每个监控集合的虚拟机监控数据采集。所述的方法还可包括步骤6:当创建新的虚拟机时,将新创建的虚拟机根据已经编好的编号和批次倒序加入监控集合;所述的倒序加入监控集合,是指当计算节点N1新创建了一台虚拟机,这台虚拟机应该在这个计算节点最后一个分组。所述的监控频率,是指每次定时触发数据采集的时间周期;所述的分批采集次数n,等于监控频率除以错位监控值,结果向下取整;所述的向下取整,是指忽略小数。所述的监控频率,是指每次定时触发数据采集的时间周期;所述的分批采集次数n,等于监控频率除以错位监控值,结果向下取整;所述的向下取整,是指忽略小数。所述的计算节点,是指虚拟化节点,为用户提供虚拟机;所述的按照预先设定进行分组并顺序编号,是指虚拟机数量小于批次向上取整,虚拟机大于批次的,将余数放在最后一组,当批次为10,计算节点N1有20台,计算节点N2有6台,则将计算节点N1每两台虚拟机一组并顺序编号,计算节点N2每一台虚拟机一组并顺序编号。所述的错位监控对象集合,是指每次要采集数据的虚拟机集合,主要保存虚拟机实例ID;所述的虚拟机实例ID,是指虚拟机的唯一标识。专利技术方案的有益效果如下:1、本专利技术的方法节约用户成本,在不用增加硬件配置或者数量的情况下,提高云平台监控性能及规模;2、本专利技术方法运维简单灵活,无需采用分布式部署结构,充分利用现有的监控周期将大规模监控采集实现错位采集,提供一种在保证监控数据不受影响,又不增加成本的情况下提高云平台监控性能及规模的方法。附图说明下面结合附图对本专利技术进一步说明:图1为本专利技术的流程图;图2为本专利技术的技术原理图。具体实施方式如图1所示,本专利技术具体实施过程如下:步骤1:设置错位监控值,错误监控值的两倍应该小于监控频率。步骤2:根据错位监控值与监控频率,计算在同个监控频率内所要分批采集的次数n。步骤3:将每台计算节点的虚拟机按照批次分组,分组策略为计算节点虚拟机数量除以批次,虚拟机数量小于批次向上取整,虚拟机大于批次的,将余数放在最后一组,比如批次为10,计算节点N1有20台,计算节点N2有6台,则将计算节点N1每两台虚拟机一组并顺序编号,计算节点N2每一台虚拟机一组并顺序编号。步骤4:选取每个计算节点编号一样的虚拟机组合,形成错位监控对象集合,编号不变。步骤5:根据计算的监控批次n,在同一个监测周期内,完成每个监控集合的虚拟机监控数据采集。步骤6:当创建新的虚拟机时,将新创建的虚拟机根据已经编好的编号和批次倒序加入监控集合,比如计算节点N1新创建了一台虚拟机,这台虚拟机应该在这个计算节点最后一个分组。图2为本专利技术的技术原理图,监控管理端,是指云平台专门用来做监控管理的,主要负责监控数据相关管理工作。监控代理,是指安装在每台计算节点的监控客户端,负责监控数据的采集工作,并负责向监控管理端上报监控数据。控制节点安装监控管理端,每个一分钟监控管理模块都会调用每一个计算节点的监控代理接口采集每台虚拟机各项指标性能数据,假设若没有错位监控,监控频率为1分钟,即每个一分钟监控管理模块都会调用监控代理接口采集每台虚拟机各项指标性能数据,如果这个时候有1万台虚拟机,每台虚拟机5个指标,那每次采集的数据将达到5万,即监控管理端数据库每分钟插入并发数将达到5万条,若将错位监控值设置成12秒,则会在1分钟的监控周期内将原有的5万条查询分5次,每次1万条插入记录;若错位监控值设置6秒,则会在1分钟的监控周期内将原有的5万条查询分10次,那么监控管理端数据库每分钟插入并发将将为5千条记录。然后将每台计算节点的虚拟机按照批次分组,分组策略为计算节点虚拟机数量除以批次,虚拟机数量小于批次向上取整,虚拟机大于批次的,将余数放在最后一组,比如批次为10,计算节点N1有20台,计算节点N2有6台,则将计算节点N1每两台虚拟机一组并顺序编号,计算节点N2每一台虚拟机一组并顺序编号。接着根据错位监控值与监控频率,计算在同个监控频率内所要分批采集的次数n,分批采集次数n,等于监控频率除以错位监控值,结果向下取整,忽略小数。之后选取每个计算节点编号一样的虚拟机组合,形成错位监控对象集合,编号不变,错位监控集合,是指每次要采集数据的虚拟机集合,主要保存虚拟机实例ID,虚拟机实例ID,是指虚拟机的唯一标识,最后根据计算的监控批次n,在同一个监测周期内,完成每个监控集合的虚拟机监控数据采集。本文档来自技高网...
一种提高云平台监控性能及规模的监控方法

【技术保护点】
一种提高云平台监控性能及规模的监控方法,其特征在于,所述方法的方法是在一个监控频率周期内,将单批次的监控数据采集任务分多个批次进行;实现错位监控。

【技术特征摘要】
1.一种提高云平台监控性能及规模的监控方法,其特征在于,所述方法的方法是在一个监控频率周期内,将单批次的监控数据采集任务分多个批次进行;实现错位监控。2.根据权利要求1所述的一种提高云平台监控性能及规模的监控方法,其特征在于,所述的方法具体包括如下步骤:步骤1:设置错位监控值,错位监控值的两倍小于监控频率;步骤2:根据错位监控值与监控频率,计算在同个监控频率内所要分批采集的次数n;步骤3:将每台计算节点的虚拟机按照批次分组,分组策略为计算节点虚拟机数量除以批次后,按照预先设定进行分组并顺序编号;步骤4:选取每个计算节点编号一样的虚拟机组合,形成错位监控对象集合,编号不变;步骤5:根据计算的监控批次n,在同一个监测周期内,完成每个监控集合的虚拟机监控数据采集。3.根据权利要求2所述的一种提高云平台监控性能及规模的监控方法,其特征在于,所述的方法还可包括步骤6:当创建新的虚拟机时,将新创建的虚拟机根据已经编好的编号和批次倒序加入监控集合;所述的倒序加入监控集合,是指当计算节点N1新创建了一台虚拟机,这台虚拟机应该在这个计算节点最后一个分组。4.根据权利要求2所述的一种提高云平台监控性能及规模的监控方法,其特征在于,所述的监控频率,是指每次定时触发数据采集的时间周期;所述的分批采集次...

【专利技术属性】
技术研发人员:刘勇彬杨松季统凯
申请(专利权)人:国云科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1