一种云平台故障预测诊断系统技术方案

技术编号:15726887 阅读:118 留言:0更新日期:2017-06-29 22:24
本发明专利技术公开了一种云平台故障预测诊断系统,包括故障预测模块和深度检测诊断模块,其中,故障预测模块,用于收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,并将故障类型发送给深度检测诊断模块;深度检测诊断模块,用于依据故障类型对故障进行深度检测和诊断,获得故障结论。应用本发明专利技术实施例所提供的技术方案,可以及时对云平台各资源的故障进行诊断,获得故障结论,为云平台的正常运行提供有力保障,可以降低云平台的维护成本,提高数据中心的可用性。

【技术实现步骤摘要】
一种云平台故障预测诊断系统
本专利技术涉及云计算
,特别是涉及一种云平台故障预测诊断系统。
技术介绍
随着云计算技术的快速发展,对计算资源、存储资源和网络资源统一管理和编排的技术发展的越来越成熟,使得云平台中计算、存储、网络和虚拟化操作系统等各种元素紧密地结合在一起,且规模越来越大。在云平台中,如何及时对故障进行诊断,是目前本领域技术人员亟需解决的技术问题。
技术实现思路
本专利技术的目的是提供一种云平台故障预测诊断系统,以及时对故障进行诊断,获得故障结论,为云平台的正常运行提供有力保障,可以降低云平台的维护成本,提高数据中心的可用性。为解决上述技术问题,本专利技术提供如下技术方案:一种云平台故障预测诊断系统,包括故障预测模块和深度检测诊断模块,其中,所述故障预测模块,用于收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,并将所述故障类型发送给所述深度检测诊断模块;所述深度检测诊断模块,用于依据所述故障类型对故障进行深度检测和诊断,获得故障结论。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与网络相关;如果是,则启动诊断进程或者虚拟机发送测试包,对故障进行深度检测诊断,获得故障结论。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与存储相关;如果是,则启动诊断进程或者虚拟机存储、读取测试文件,对故障进行深度检测诊断,获得故障结论。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与计算相关;如果是,则启动诊断进程或者虚拟机存储、读取内存数据,对故障进行深度检测诊断,获得故障结论。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与虚拟化软件相关;如果是,则启动虚拟机分配、存储网络,对故障进行深度检测诊断,获得故障结论。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否为硬件损伤类故障或环境故障;如果是,则直接记录所述故障类型。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,还用于确定所述故障结论是否符合预设的反馈条件;如果是,则将所述故障结论反馈给所述故障预测模块;所述故障预测模块,还用于在接收到所述深度检测诊断模块反馈的故障结论时,基于收集到的各类数据和所述故障结论预测可能存在的故障的故障类型,重复执行所述将所述故障类型发送给所述深度检测诊断模块的步骤。在本专利技术的一种具体实施方式中,所述深度检测诊断模块,还用于在根据所述故障结论,确定存在的故障的具体内容时,进行故障记录。在本专利技术的一种具体实施方式中,还包括故障修复模块,所述深度检测诊断模块,还用于在确定存在的故障的具体内容时,确定存在的故障是否符合预设的修复条件;如果是,则启用所述故障修复模块对所述存在的故障进行修复。在本专利技术的一种具体实施方式中,所述故障类型包括资源配置类型、器件物理损伤类型、环境类型、虚拟化软件类型、未知类型。应用本专利技术实施例所提供的技术方案,故障预测模块收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,将故障类型发送给深度检测诊断模块,深度检测诊断模块依据该故障类型对故障进行深度检测和诊断,获得故障结论。及时对云平台各资源的故障进行诊断,获得故障结论,为云平台的正常运行提供有力保障,可以降低云平台的维护成本,提高数据中心的可用性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中云平台故障预测诊断系统的一种结构示意图;图2为本专利技术实施例中资源运行数据及故障类型示意图;图3为本专利技术实施例中云平台故障预测诊断系统的另一种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1所示,为本专利技术实施例所提供的一种云平台故障预测诊断系统的结构示意图,该系统包括故障预测模块110和深度检测诊断模块120。故障预测模块110,用于收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,并将故障类型发送给深度检测诊断模块120;深度检测诊断模块120,用于依据故障类型对故障进行深度检测和诊断,获得故障结论。在本专利技术实施例中,故障预测模块110可以与构建云平台的各业务系统、业务模块连接,通过监测,可以获得计算资源、存储资源和网络资源等的运行状态数据和告警数据,对各种资源的运行数据进行收集。基于收集到的各类数据,故障预测模块110可以预测当前是否存在故障及可能存在的故障的故障类型。可以预先设定各类数据与故障类型的对应关系。举例而言,如图2所示,故障预测模块110可以收集到的各种资源的运行数据可以有以下几类:第一类数据:云平台资源运行状态数据。如服务器CPU占用率、虚拟机CPU占用率、服务器内存占用率、虚拟机内存占用率、网络连接带宽占用率、网络连接错包增长率、虚拟机IOPS、服务器IOPS等;第二类数据:硬件或芯片上记录的告警数据。如CPU硬件告警数据、内存硬件告警数据、存储硬件告警数据、网络硬件告警数据、其它硬件告警数据等;第三类数据:应用程序告警接口告警数据。云操作系统可以给运行在服务器上的进程或者运行在虚拟机里的进程提供告警接口,应用程序进程可以调用相关接口给云平台报警,如CPU资源不足、内存不够、硬盘不够或访问太慢、网络带宽不足等;第四类数据:模拟应用检测系统告警数据。可以启用模拟程序探测系统是否潜在存在故障,模拟程序可以是服务器上的进程或虚拟机,可以是web访问应用或是数据库应用;第五类数据:各种环境传感器告警数据。可以通过云平台中各种传感器报上来的告警数据判断环境是否存在问题导致云平台中故障发生,比如温度、湿度、电量、烟雾、粉尘、水浸、震动等环境变量是否异常;第六类数据:其它采集数据。可以通过非上述情况采集到的其它有利于分析故障的数据。故障预测模块110基于收集到的各类数据,可以预测可能存在的故障的故障类型有以下几种,如图2所示:第一种类型:资源配置类型,如CPU超额配置、内存超额配置、存储超额配置、网络拥塞等;第二种类型:器件物理损伤类型,如CPU物理损伤、内存物理损伤、存储物理损伤、网络物理损伤、其它器件损伤等;第三种类型:环境类型,如温度异常、湿度异常、电量异常、烟雾过大、粉尘过低、有水浸、有异常震动等;第四种类型:虚拟化软件类型,如硬件资源足够但不能被分配,硬件工作正常但上层应用不能正常使用等;第五种类型:未知类型,预测可能存在故障,但和已知故障类型不匹配。故障预测模块110预测可能存在的故障的故障类型后,本文档来自技高网
...
一种云平台故障预测诊断系统

【技术保护点】
一种云平台故障预测诊断系统,其特征在于,包括故障预测模块和深度检测诊断模块,其中,所述故障预测模块,用于收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,并将所述故障类型发送给所述深度检测诊断模块;所述深度检测诊断模块,用于依据所述故障类型对故障进行深度检测和诊断,获得故障结论。

【技术特征摘要】
1.一种云平台故障预测诊断系统,其特征在于,包括故障预测模块和深度检测诊断模块,其中,所述故障预测模块,用于收集云平台中各种资源的运行数据,基于收集到的各类数据预测是否存在故障,及可能存在的故障的故障类型,并将所述故障类型发送给所述深度检测诊断模块;所述深度检测诊断模块,用于依据所述故障类型对故障进行深度检测和诊断,获得故障结论。2.根据权利要求1所述的云平台故障预测诊断系统,其特征在于,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与网络相关;如果是,则启动诊断进程或者虚拟机发送测试包,对故障进行深度检测诊断,获得故障结论。3.根据权利要求1所述的云平台故障预测诊断系统,其特征在于,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与存储相关;如果是,则启动诊断进程或者虚拟机存储、读取测试文件,对故障进行深度检测诊断,获得故障结论。4.根据权利要求1所述的云平台故障预测诊断系统,其特征在于,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与计算相关;如果是,则启动诊断进程或者虚拟机存储、读取内存数据,对故障进行深度检测诊断,获得故障结论。5.根据权利要求1所述的云平台故障预测诊断系统,其特征在于,所述深度检测诊断模块,具体用于依据所述故障类型,确定故障是否与虚拟化软件相关;如果是,则启动虚...

【专利技术属性】
技术研发人员:陈彦灵吴安石江涛
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1