一种数据库故障的处理方法及装置制造方法及图纸

技术编号:14061236 阅读:53 留言:0更新日期:2016-11-27 18:07
本发明专利技术提供了一种数据库故障的处理方法及装置,涉及数据库领域,解决现有内存数据库不能及时监控并处理数据库故障的问题,该方法包括:获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;根据第一检测值确定数据库的第一运行状态,并在数据库的第一运行状态为故障状态时,对数据库的中间临时表进行第一次统计收集;获取预设的监控事件在对数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值;根据第二检测值确定数据库的第二运行状态,并在数据库的第二运行状态为故障状态时,对数据库的全库表进行第二次统计收集。本发明专利技术的方案能及时监控并处理由于表统计收集不及时引起的故障,提高了处理效率。

【技术实现步骤摘要】

本专利技术涉及数据库领域,特别涉及一种数据库故障的处理方法及装置
技术介绍
TimesTen内存数据库是运行过程中全部数据、事务变更操作在内存中完成的数据库。内存是业界当前公认最快的存储装置,因此TimesTen内存数据常被用于业务响应及时性要求非常高的场景。目前的通信业务系统中,计费系统是业务响应要求非常高的,一般要求在1秒以内完成响应。因此通信行业中,TimesTen内存数据库被用于计费系统中。但Timesten数据库这个产品本身没有提供表的统计收集功能,而表的统计信息是否准确对于数据库的业务性能快慢、效率高低起到决定性的作用。为了保证数据库的正常稳定运行,一般都会选择在数据库业务运行闲时部署表对象的例行统计收集。在业务闲时部署表对象的例行统计收集,一般情况下能够保证Timesten内存数据库的稳定运行,但在计费系统忙时,由于表的统计收集不及时,很容易引起表统计收集的数据与表(特别是中间临时表)中实际存在数据差异量过大,从而引起系统运行缓慢,业务无法处理,甚至挂机。而Timesten内存数据库本身不能监控到这类故障,会导致故障时间过长,这是计费系统不可接受的。
技术实现思路
本专利技术要解决的技术问题是提供一种数据库故障的处理方法及装置,解决现有内存数据库不能及时监控并处理由于表统计收集不及时引起的故障的问题。为解决上述技术问题,本专利技术的实施例提供一种数据库故障的处理方法,
所述处理方法包括:获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;根据所述第一检测值确定所述数据库的第一运行状态,并在所述数据库的第一运行状态为故障状态时,对所述数据库的中间临时表进行第一次统计收集;获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值;根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表进行第二次统计收集。其中,所述预设的监控事件包括:对数据库运行过程中的CPU使用率的监控和/或离线话单率的监控;所述获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值的步骤包括:对数据库运行过程中的CPU使用率监控时,获取对数据库CPU使用率检测的第一CPU使用率;和/或对数据库运行过程中的离线话单率监控时,获取对数据库离线话单率检测的第一离线话单率。其中,所述根据所述第一检测值确定所述数据库的第一运行状态的步骤包括:若所述第一CPU使用率大于第一预设值或所述第一离线话单率大于第二预设值,则确定所述数据库的第一运行状态为故障状态。其中,所述获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值的步骤包括:获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库CPU使用率检测的第二CPU使用率;和/或获取对数据库运行过程中的离线话单率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库离线话单率检测的第二离线话单率。其中,所述根据所述第二检测值确定所述数据库的第二运行状态的步骤包
括:若所述第二CPU使用率大于所述第一预设值或所述第二离线话单率大于所述第二预设值,则确定所述数据库的第二运行状态为故障状态。其中,所述根据所述第二检测值确定所述数据库的第二运行状态之后还包括:在所述数据库的第二运行状态为故障状态时,发出第一次告警。其中,所述根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表进行第二次统计收集之后还包括:获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库CPU使用率检测的第三CPU使用率;和/或获取对数据库运行过程中的离线话单率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库离线话单率检测的第三离线话单率。其中,所述处理方法还包括:若所述第三CPU使用率大于所述第一预设值或所述第三离线话单率大于所述第二预设值,则确定所述数据库的第三运行状态为故障状态,并在所述数据库的第三运行状态为故障状态时,发出第二次告警。为解决上述技术问题,本专利技术的实施例还提供一种数据库故障的处理装置,所述处理装置包括:第一获取模块,用于获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;第一统计收集模块,用于根据所述第一检测值确定所述数据库的第一运行状态,并在所述数据库的第一运行状态为故障状态时,对所述数据库的中间临时表进行第一次统计收集;第二获取模块,用于获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值;第二统计收集模块,用于根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表
进行第二次统计收集。其中,所述预设的监控事件包括:对数据库运行过程中的CPU使用率的监控和/或离线话单率的监控;所述第一获取模块包括:第一获取子模块,用于对数据库运行过程中的CPU使用率监控时,获取对数据库CPU使用率检测的第一CPU使用率;和/或第二获取子模块,用于对数据库运行过程中的离线话单率监控时,获取对数据库离线话单率检测的第一离线话单率。其中,所述第一统计收集模块包括:第一确定模块,用于若所述第一CPU使用率大于第一预设值或所述第一离线话单率大于第二预设值,则确定所述数据库的第一运行状态为故障状态。其中,所述第二获取模块包括:第三获取子模块,用于获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库CPU使用率检测的第二CPU使用率;和/或第四获取子模块,用于获取对数据库运行过程中的离线话单率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库离线话单率检测的第二离线话单率。其中,所述第二统计收集模块包括:第二确定模块,用于若所述第二CPU使用率大于所述第一预设值或所述第二离线话单率大于所述第二预设值,则确定所述数据库的第二运行状态为故障状态。其中,所述处理装置还包括:第一告警模块,用于在所述数据库的第二运行状态为故障状态时,发出第一次告警。其中,所述处理装置还包括:第三获取模块,用于获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库CPU使用率检测的第三CPU使用率;和/或第四获取模块,用于获取对数据库运行过程中的离线话单率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库离线话单率检测的第三离线话单率。其中,所述处理装置还包括:第二告警模块,用于若所述第三CPU使用率大于所述第一预设值或所述第三离线话单率大于所述第二预设值,则确定所述数据库的第三运行状态为故障状态,并在所述数据库的第三运行状态为故障状态时,发出第二次告警。本专利技术的上述技术方案的有益效果如下:本专利技术实施例的数据库故障的处理方法,首先获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;然后根据第一检测值确定数据库的第一运行状态,本文档来自技高网
...
一种数据库故障的处理方法及装置

【技术保护点】
一种数据库故障的处理方法,其特征在于,所述处理方法包括:获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;根据所述第一检测值确定所述数据库的第一运行状态,并在所述数据库的第一运行状态为故障状态时,对所述数据库的中间临时表进行第一次统计收集;获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值;根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表进行第二次统计收集。

【技术特征摘要】
1.一种数据库故障的处理方法,其特征在于,所述处理方法包括:获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值;根据所述第一检测值确定所述数据库的第一运行状态,并在所述数据库的第一运行状态为故障状态时,对所述数据库的中间临时表进行第一次统计收集;获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值;根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表进行第二次统计收集。2.根据权利要求1所述的处理方法,其特征在于,所述预设的监控事件包括:对数据库运行过程中的CPU使用率的监控和/或离线话单率的监控;所述获取数据库运行过程中预设的监控事件对数据库运行效率检测的第一检测值的步骤包括:对数据库运行过程中的CPU使用率监控时,获取对数据库CPU使用率检测的第一CPU使用率;和/或对数据库运行过程中的离线话单率监控时,获取对数据库离线话单率检测的第一离线话单率。3.根据权利要求2所述的处理方法,其特征在于,所述根据所述第一检测值确定所述数据库的第一运行状态的步骤包括:若所述第一CPU使用率大于第一预设值或所述第一离线话单率大于第二预设值,则确定所述数据库的第一运行状态为故障状态。4.根据权利要求3所述的处理方法,其特征在于,所述获取所述预设的监控事件在对所述数据库的中间临时表进行第一次统计收集之后的数据库运行效率检测的第二检测值的步骤包括:获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库CPU使用率检测的第二CPU使用率;和/或获取对数据库运行过程中的离线话单率监控时,在对所述数据库的中间临时表进行第一次统计收集之后的数据库离线话单率检测的第二离线话单率。5.根据权利要求4所述的处理方法,其特征在于,所述根据所述第二检测值确定所述数据库的第二运行状态的步骤包括:若所述第二CPU使用率大于所述第一预设值或所述第二离线话单率大于所述第二预设值,则确定所述数据库的第二运行状态为故障状态。6.根据权利要求1所述的处理方法,其特征在于,所述根据所述第二检测值确定所述数据库的第二运行状态之后还包括:在所述数据库的第二运行状态为故障状态时,发出第一次告警。7.根据权利要求5所述的处理方法,其特征在于,所述根据所述第二检测值确定所述数据库的第二运行状态,并在所述数据库的第二运行状态为故障状态时,对所述数据库的全库表进行第二次统计收集之后还包括:获取对数据库运行过程中的CPU使用率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库CPU使用率检测的第三CPU使用率;和/或获取对数据库运行过程中的离线话单率监控时,在对所述数据库的全库表进行第二次统计收集之后的数据库离线话单率检测的第三离线话单率。8.根据权利要求7所述的处理方法,其特征在于,所述处理方法还包括:若所述第三CPU使用率大于所述第一预设值或所述第三离线话单率大于所述第二预设值,则确定所述数据库的第三运行状态为故障状态,并在所述数据...

【专利技术属性】
技术研发人员:张炳华陈东明陈辉周世超何林艳
申请(专利权)人:中国移动通信集团广东有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1