An application server system and method for detecting the reliability of an application server comprise an access front-end device, a server exception notification message sent by the detection device is forwarded to the self-healing device, and an external message received by the application server is transmitted through the message, when the self-healing completion message of the recovery device is received. The external message received by the application server is processed according to the existing business process; the detection device detects whether an exception occurs within the application server at a certain interval of time; when an exception is detected, the server exception notification message is sent to the access pre-device; and the self-healing device receives the access pre-device when an exception is detected. When the server exception notification message is sent, the application server is restarted or reconstructed. After completion, the self-healing completion message is returned to the access pre-module. The invention belongs to the field of communication, and can realize millisecond detection of the application server abnormality in the telecommunication network, thereby reducing the negative impact on the existing network and user feelings.
【技术实现步骤摘要】
一种应用服务器可靠性的检测系统和方法
本专利技术涉及一种应用服务器可靠性的检测系统和方法,属于通信领域。
技术介绍
在电信网络中,对于各个模块、设备的稳定性和鲁棒性有很高的要求。尤其应用服务器是在电信网络中处理与传输通话消息协议的重要模块,在应用服务器出现异常之后,要求必须及时对呼叫进行放行,不会因为应用服务器异常而使链路产生大量呼损。在传统的检测机制中,对于应用服务器的健康检测只是基于option心跳机制,检测也只能秒级的发现问题。不仅如此,即使心跳存在也无法保证业务完全正常工作,从发现应用服务器出现异常到恢复正常的过程中用时相对较长,对于通话质量与用户的感受影响较大。因此,如何对电信网络中的应用服务器发生异常实现毫秒级检测,有效降低应用服务器异常对现网和用户感受所造成的负面影响,已成为技术人员普遍关注的技术问题。
技术实现思路
有鉴于此,本专利技术的目的是提供一种应用服务器可靠性的检测系统和方法,能对电信网络中的应用服务器发生异常实现毫秒级检测,有效降低应用服务器异常对现网和用户感受所造成的负面影响。为了达到上述目的,本专利技术提供了一种应用服务器可靠性的检测系统,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自 ...
【技术保护点】
1.一种应用服务器可靠性的检测系统,其特征在于,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常。
【技术特征摘要】
1.一种应用服务器可靠性的检测系统,其特征在于,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常。2.根据权利要求1所述的系统,其特征在于,检测装置进一步包括有:硬件检测单元,用于接收应用服务器内部的其他装置发送来的心跳消息,当在一个检测周期内未收到其中一个或多个其他装置发来的心跳消息时,则向接入前置模块发送服务器异常通知消息;业务检测单元,用于按一定的时长间隔,模拟现有业务流程运行,并判断业务流程运行后的结果是否正常,如果否,则向接入前置模块发送服务器异常通知消息,并填写错误日志。3.根据权利要求2所述的系统,其特征在于,硬件检测单元进一步包括有:业务指标读取部件,用于获取应用服务器在当前检测周期T、以及与当前检测周期相邻的上一检测周期T'内的若干业务指标,所述业务指标包括但不限于:任务量、处置量、黑名单量、白名单量、灰名单量;设备指标读取部件,分别获取应用服务器在当前检测周期T、以及上一检测周期T'内的若干设备指标期望值及其上限值,所述设备指标期望值及其上限值包括但不限于:CPU期望值及上限值、内存期望值及上限值、硬盘使用率期望值及上限值、I/O期望值及上限值;业务运行矩阵构建部件,用于根据应用服务器在当前检测周期T、以及上一检测周期T'内的业务指标、设备指标期望值及其上限值,分别构建应用服务器在当前检测周期T、以及上一个检测周期T'的业务运行矩阵M(T)、M(T'),其中,mij是M(T)或M(T')中的第i列第j行元素,Vi是应用服务器在T或T'内的第i个业务指标,AVGj是应用服务器在T或T'内的第j个设备指标期望值,Upperj是应用服务器在T或T'内的第j个设备指标上限值,t是当前检测周期的时长,单位为秒,i∈[1,N],j∈[1,M],N是应用服务器的业务指标数,M是应用服务器的设备指标数;硬件周期调整部件,用于计算检测周期的时长变更指数AVGelt:其中,分别是M(T)、M(T')中的第i列第j行元素,并当AVGelt大于1+k时,调整检测周期的时长:其中,t'是调整后的检测周期的时长,k是浮动值,P是可调参数。4.根据权利要求2所述的系统,其特征在于,业务检测单元进一步包括有:业务周期调整部件,用于从错误日志中读取模拟业务流程运行中出现的错误数及对应的错误级别,然后调整检测周期的时长:其中,t是调整后的检测周期的时长,t是当前检测周期的时长,wf是第f级错误级别的权重,sf是模拟业务流程运行中出现的第f级错误级别的错误数,F是错误级别数。5.根据权利要求1所述的系统,其特征在于,接入前置装置进一步包括有:消息透传单元,用于将应用...
【专利技术属性】
技术研发人员:万辛,李鹏,安茂波,董博谦,陈杰,沈亮,王昭,王方青,高旭,
申请(专利权)人:国家计算机网络与信息安全管理中心,杭州东信北邮信息技术有限公司,长安通信科技有限责任公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。