一种上报设备异常的方法和装置制造方法及图纸

技术编号:20865724 阅读:30 留言:0更新日期:2019-04-17 09:12
本发明专利技术公开了一种上报设备异常的方法和装置,属于计算机技术领域。所述方法包括:当监控到设备的目标进程的性能指标出现异常时,采集运行数据;在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果;如果所述异常分析结果指示为上报异常,则将所述异常分析结果进行上报,否则排除此次异常。采用本发明专利技术,可以节省基于设备出现的异常现象,判断设备是否会出现故障问题时用户花费的时间和精力,以及用于异常分析的设备处理资源。

【技术实现步骤摘要】
一种上报设备异常的方法和装置
本专利技术涉及计算机
,特别涉及一种上报设备异常的方法和装置。
技术介绍
设备在运行的过程中,经常会因为硬件或软件上的问题出现运行故障,从而可能导致设备处理能力下降、执行逻辑错误,甚至会出现设备宕机、组件损坏等现象。为了能尽早发现设备的运行故障,用户可以通过性能监控程序(可称为监控工具)查看设备的性能指标,了解设备的运行状态。设备在出现运行故障之前,往往会出现一些异常现象,这些异常现象可以通过设备的性能指标得到反映。以进程为例,当设备运行的某进程运行异常时,反映进程运行异常的性能指标——进程的CPU使用率,将超出正常范围,这时,运行在设备上的监控工具可以检测到上述性能指标异常,然后可以对相应的运行数据进行采集,如正在运行的各进程的进程号、CPU使用率以及调用的各个函数等数据。之后,监控工具可以将采集的运行数据发送给用户,以使用户可以通过这些运行数据,对设备出现的异常现象进行分析,判断设备是否可能出现故障问题。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:只要检测到性能指标异常,监控工具就会将采集的性能数据发送给用户,这将消耗大量的设备处理资源。并且,监控工具采集的运行数据,其数据量往往很大,尤其当用户对多台设备进行监控时,需要分析的数据量将会极其巨大,导致用户需要花费较长的时间才可能基于设备出现的异常现象,判断设备是否会出现故障问题,浪费了用户大量的时间和精力。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种上报设备异常的方法和装置。所述技术方案如下:第一方面,提供了一种上报设备异常的方法,所述方法包括:当监控到设备的目标进程的性能指标出现异常时,采集运行数据;对所述运行数据进行异常进程分析,生成异常分析结果;如果所述异常分析结果指示为上报异常,则将所述异常分析结果进行上报,否则排除此次异常。进一步的,所述在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果,包括:如果在预设时段内所述目标进程的CPU使用率小于所述预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。进一步的,所述在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果,包括:基于预设下降率和所述目标进程的CPU使用率,计算下降后的CPU使用率;如果所述下降后的CPU使用率小于所述预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。进一步的,所述目标进程包括多个线程;所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:在所述多个线程中确定处理主要业务且处于运行态的线程数目,并将所述目标进程的CPU使用率除以所述线程数目,得到平均线程使用率;如果所述平均线程使用率大于等于所述预设阈值,则生成上报所述目标进程存在多线程跑高的异常分析结果,否则生成不上报异常的异常分析结果。进一步的,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:判断所述目标进程是否与任一CPU逻辑核绑定;如果是,则生成上报所述目标进程与CPU逻辑核绑定的异常分析结果,否则生成上报所述目标进程与CPU逻辑核未绑定的异常分析结果。进一步的,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:判断所述目标进程是否属于由定时任务启动的进程;如果是,则生成上报所述目标进程属于由定时任务启动的进程的异常分析结果,否则生成上报所述目标进程不属于由定时任务启动的进程的异常分析结果。进一步的,所述判断所述目标进程是否属于由定时任务启动的进程,包括:在进程树中向上遍历,确定包含所述目标进程的上级进程的进程名;如果所述上级进程的进程名中包含有CROND,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动的进程。进一步的,所述判断所述目标进程是否属于由定时任务启动的进程,包括:在CRONTAB配置文件中查找所述目标进程的进程名;如果查找到所述目标进程的进程名,则判断监控到所述目标进程的性能指标出现异常的时刻是否属于所述CRONTAB配置文件为所述目标进程配置的执行周期;如果是,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动的进程。进一步的,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:统计预设采样时段中各个函数的调用次数以及所有函数的调用总次数;计算每个所述函数的所述调用次数占所述调用总次数的调用比值,按照所述调用比值由高到低的顺序对各个所述函数进行排序;分别计算每个所述函数的所述调用比值和其之后一序位的所述函数的调用比值的差值,占每个所述函数的所述调用比值的落差比值;生成上报包含有最大的所述落差比值对应的所述函数及其之前的所有所述函数的所述运行数据的异常分析结果。第二方面,提供了一种上报设备异常的装置,所述装置包括:采集模块,用于当监控到设备的目标进程的性能指标出现异常时,采集运行数据;分析模块,用于在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果;上报模块,用于如果所述异常分析结果指示为上报异常,则将所述异常分析结果进行上报,否则排除此次异常。进一步的,所述分析模块具体用于:如果在预设时段内所述目标进程的CPU使用率小于所述预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。进一步的,所述分析模块具体用于:基于预设下降率和所述目标进程的CPU使用率,计算下降后的CPU使用率;如果所述下降后的CPU使用率小于所述预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。进一步的,所述目标进程包括多个线程;所述分析模块具体用于:在所述多个线程中确定处理主要业务且处于运行态的线程数目,并将所述目标进程的CPU使用率除以所述线程数目,得到平均线程使用率;如果所述平均线程使用率大于等于所述预设阈值,则生成上报所述目标进程存在多线程跑高的异常分析结果,否则生成不上报异常的异常分析结果。进一步的,所述分析模块具体用于:判断所述目标进程是否与任一CPU逻辑核绑定;如果是,则生成上报所述目标进程与CPU逻辑核绑定的异常分析结果,否则生成上报所述目标进程与CPU逻辑核未绑定的异常分析结果。进一步的,所述分析模块具体用于:判断所述目标进程是否属于由定时任务启动的进程;如果是,则生成上报所述目标进程属于由定时任务启动的进程的异常分析结果,否则生成上报所述目标进程不属于由定时任务启动的进程的异常分析结果。进一步的,所述装置还包括定时判断模块,用于:在进程树中向上遍历,确定包含所述目标进程的上级进程的进程名;如果所述上级进程的进程名中包含有CROND,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动的进程。进一步的,所述装置还包括定时判断模块,用于:在CRONTAB配置文件中查找所述目标进程的进程名;如果查找到所述目标进程的进程名,则判断监控到所述目标进程的性能指标出现异常的时刻是否属于所述CRONTAB配置文件为所述目标进程配置的执行周期;如果是,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动本文档来自技高网...

【技术保护点】
1.一种上报设备异常的方法,其特征在于,所述方法包括:当监控到设备的目标进程的性能指标出现异常时,采集运行数据;在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果;如果所述异常分析结果指示为上报异常,则将所述异常分析结果进行上报,否则排除此次异常。

【技术特征摘要】
1.一种上报设备异常的方法,其特征在于,所述方法包括:当监控到设备的目标进程的性能指标出现异常时,采集运行数据;在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果;如果所述异常分析结果指示为上报异常,则将所述异常分析结果进行上报,否则排除此次异常。2.根据权利要求1所述的方法,其特征在于,所述在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果,包括:如果在预设时段内所述目标进程的CPU使用率小于预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。3.根据权利要求1所述的方法,其特征在于,所述在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果,包括:基于预设下降率和所述目标进程的CPU使用率,计算下降后的CPU使用率;如果所述下降后的CPU使用率小于预设阈值,则排除此次异常,否则在所述设备处对所述运行数据进行异常进程分析,生成异常分析结果。4.根据权利要求1-3任一所述的方法,其特征在于,所述目标进程包括多个线程;所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:在所述多个线程中确定处理主要业务且处于运行态的线程数目,并将所述目标进程的CPU使用率除以所述线程数目,得到平均线程使用率;如果所述平均线程使用率大于等于预设阈值,则生成上报所述目标进程存在多线程跑高的异常分析结果,否则生成不上报异常的异常分析结果。5.根据权利要求1-3任一所述的方法,其特征在于,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:判断所述目标进程是否与任一CPU逻辑核绑定;如果是,则生成上报所述目标进程与CPU逻辑核绑定的异常分析结果,否则生成上报所述目标进程与CPU逻辑核未绑定的异常分析结果。6.根据权利要求1-3任一所述的方法,其特征在于,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:判断所述目标进程是否属于由定时任务启动的进程;如果是,则生成上报所述目标进程属于由定时任务启动的进程的异常分析结果,否则生成上报所述目标进程不属于由定时任务启动的进程的异常分析结果。7.根据权利要求6所述的方法,其特征在于,所述判断所述目标进程是否属于由定时任务启动的进程,包括:在进程树中向上遍历,确定包含所述目标进程的上级进程的进程名;如果所述上级进程的进程名中包含有CROND,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动的进程。8.根据权利要求6所述的方法,其特征在于,所述判断所述目标进程是否属于由定时任务启动的进程,包括:在CRONTAB配置文件中查找所述目标进程的进程名;如果查找到所述目标进程的进程名,则判断监控到所述目标进程的性能指标出现异常的时刻是否属于所述CRONTAB配置文件为所述目标进程配置的执行周期;如果是,则判断所述目标进程属于由定时任务启动的进程,否则判断所述目标进程不属于由定时任务启动的进程。9.根据权利要求1-3任一所述的方法,其特征在于,所述对所述运行数据进行异常进程分析,生成异常分析结果,包括:统计预设采样时段中各个函数的调用次数以及所有函数的调用总次数;计算每个所述函数的所述调用次数占所述调用总次数的调用比值,按照所述调用比值由高到低的顺序对各个所述函数进行排序;分别计算每个所述函数的所述调用比值和其之后一序位的所述函数的调用比值的差值,占每个所述函数的所述调用比值的落差比值;生成上报包含有最大的所述落差比值对应的所述函数及其之前的所有所述函数的所述运行数据的异常分析结果。10.一种上报设备异常的装置,其特征在于,所述装置包括:采集模块,用于当监控到设备的目标进程的性能指标出现异常时,采集运行数据;分析模块...

【专利技术属性】
技术研发人员:陈涛
申请(专利权)人:网宿科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1