【技术实现步骤摘要】
检测虚拟机异常的方法、装置、设备和计算机存储介质
[0001]本申请涉及计算机
,特别涉及云计算
中的检测虚拟机异常的方法、装置、设备和计算机存储介质。
技术介绍
[0002]在公有云场景下,同一个虚拟机可能在多个业务模块中状态不一致,这就造成了后端运维人员在检测虚拟机状态异常时存在困难。目前采用的方案主要是针对某一模块的虚拟机状态,由运维人员凭经验针对每种状态设置一个固定的时间阈值,若虚拟机处于某一种状态的持续时间超过设置的时间阈值,则进行告警,认为该虚拟机异常。然而,这种凭经验设置时间阈值的方式往往不能够符合实际的状况,造成虚拟机异常检测不准确。例如,凭经验值设置的时间阈值过长,会导致处于异常的虚拟机不能被及时检测,增加虚拟机的不可用时间。
技术实现思路
[0003]有鉴于此,本申请提供了一种检测虚拟机异常的方法、装置、设备和计算机存储介质,以便于提高虚拟机异常检测的准确性。
[0004]第一方面,本申请提供了一种检测虚拟机异常的方法,该方法包括:
[0005]针对虚拟机的待监 ...
【技术保护点】
【技术特征摘要】
1.一种检测虚拟机异常的方法,其特征在于,该方法包括:针对虚拟机的待监控状态设置初始的第一时间阈值和第二时间阈值;检测所述待监控状态的持续时长;若所述待监控状态的持续时长大于或等于第一时间阈值,则确定处于所述待监控状态的虚拟机异常并发出告警;若所述待监控状态的持续时长大于或等于第一时间阈值与第二时间阈值的差值,且小于第一时间阈值,则对处于所述待监控状态的虚拟机进行预警,以便人工对被预警的虚拟机进行异常确认,利用人工确认的异常虚拟机中所述待监控状态的持续时长更新所述第一时间阈值,转至所述检测所述待监控状态的持续时长的步骤。2.根据权利要求1所述的方法,其特征在于,该方法还包括:将各业务模块分别维护的虚拟机状态进行组合,得到虚拟机在所有业务模块的组合状态;将得到的各组合状态分别作为所述待监控状态,用于检测虚拟机异常。3.根据权利要求2中所述的方法,其特征在于,在所述将得到的各组合状态分别作为所述待监控状态之前,还包括:过滤掉所述得到的各组合状态中实际不存在的状态和正常状态,所述正常状态没有持续时长的限制。4.根据权利要求2所述的方法,其特征在于,该方法还包括:确定所述得到的各组合状态中的错误状态,一旦检测到出现所述错误状态,则确定处于所述错误状态的虚拟机异常。5.根据权利要求1所述的方法,其特征在于,利用人工确认的异常虚拟机中所述待监控状态的持续时长更新所述第一时间阈值,包括:将人工确认的异常虚拟机中所述待监控状态的最大持续时长作为更新后的第一时间阈值。6.根据权利要求1所述的方法,其特征在于,在所述对处于所述待监控状态的虚拟机进行预警之后,还包括:若人工确认被预警的虚拟机中不存在异常,则不更新第一时间阈值,转至所述检测所述待监控状态的持续时长的步骤。7.根据权利要求1所述的方法,其特征在于,该方法还包括:所述人工对被预警的虚拟机进行异常确认后,采集确认的异常虚拟机占被预警的虚拟机的比例,依据所述比例调整所述第二时间阈值。8.根据权利要求7所述的方法,其特征在于,依据所述比例调整所述第二时间阈值包括:依据预先确定的比例与第二时间阈值之间的线性关系,确定所述采集到的比例对应的第二时间阈值,所述线性关系保证所述确认的异常虚拟机占被预警的虚拟机的比例在预设范围内;将确定出的第二时间阈值作为更新后的第二时间阈值。9.根据权利要求1所述的方法,其特征在于,该方法还包括:若满足预设的收敛条件,则停止对第一时间阈值的更新;
其中,所述预设的收敛条件包括:在预设时长内进行预警的次数小于预设预警次数阈值;或者,没有预警的连续时长超过预设的时长阈值;或者,对第一时间阈值的更新次数超过预设更新次数阈值。10.一种检测虚拟机异常的装置,其特征在于,该装置包括:阈值设置单元,用于针对虚拟机的待监控状态设置初始的第一时间...
【专利技术属性】
技术研发人员:高帆,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。