一种应用服务器可靠性的检测系统和方法技术方案

技术编号:19263253 阅读:43 留言:0更新日期:2018-10-27 02:16
一种应用服务器可靠性的检测系统和方法,应用服务器包含:接入前置装置,将检测装置发送来的服务器异常通知消息转发自愈装置,同时,将应用服务器接收到的外部消息进行消息透传;当接收到自愈装置的自愈完成消息时,将应用服务器接收到的外部消息按现有业务流程进行处理;检测装置,按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到异常时,向接入前置装置发送服务器异常通知消息;自愈装置,当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或重构,在完成后,向接入前置模块返回自愈完成消息。本发明专利技术属于通信领域,能对电信网中应用服务器发生异常实现毫秒级检测,降低对现网和用户感受所造成的负面影响。

A detection system and method for application server reliability

An application server system and method for detecting the reliability of an application server comprise an access front-end device, a server exception notification message sent by the detection device is forwarded to the self-healing device, and an external message received by the application server is transmitted through the message, when the self-healing completion message of the recovery device is received. The external message received by the application server is processed according to the existing business process; the detection device detects whether an exception occurs within the application server at a certain interval of time; when an exception is detected, the server exception notification message is sent to the access pre-device; and the self-healing device receives the access pre-device when an exception is detected. When the server exception notification message is sent, the application server is restarted or reconstructed. After completion, the self-healing completion message is returned to the access pre-module. The invention belongs to the field of communication, and can realize millisecond detection of the application server abnormality in the telecommunication network, thereby reducing the negative impact on the existing network and user feelings.

【技术实现步骤摘要】
一种应用服务器可靠性的检测系统和方法
本专利技术涉及一种应用服务器可靠性的检测系统和方法,属于通信领域。
技术介绍
在电信网络中,对于各个模块、设备的稳定性和鲁棒性有很高的要求。尤其应用服务器是在电信网络中处理与传输通话消息协议的重要模块,在应用服务器出现异常之后,要求必须及时对呼叫进行放行,不会因为应用服务器异常而使链路产生大量呼损。在传统的检测机制中,对于应用服务器的健康检测只是基于option心跳机制,检测也只能秒级的发现问题。不仅如此,即使心跳存在也无法保证业务完全正常工作,从发现应用服务器出现异常到恢复正常的过程中用时相对较长,对于通话质量与用户的感受影响较大。因此,如何对电信网络中的应用服务器发生异常实现毫秒级检测,有效降低应用服务器异常对现网和用户感受所造成的负面影响,已成为技术人员普遍关注的技术问题。
技术实现思路
有鉴于此,本专利技术的目的是提供一种应用服务器可靠性的检测系统和方法,能对电信网络中的应用服务器发生异常实现毫秒级检测,有效降低应用服务器异常对现网和用户感受所造成的负面影响。为了达到上述目的,本专利技术提供了一种应用服务器可靠性的检测系统,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常。为了达到上述目的,本专利技术还提供了一种应用服务器可靠性的检测方法,包含有:按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,则对应用服务器进行重启或者重构,同时,将应用服务器接收到的所有外部消息进行消息透传,直至重启或者重构完成后,再按现有业务流程对应用服务器接收到的外部消息进行处理。与现有技术相比,本专利技术的有益效果是:本专利技术可以从硬件的心跳健康检查、和基于业务进行完整的业务检测两方面来检测应用服务器是否发生异常,检测能毫秒级的发现问题,并且一旦发现问题及时将话路信令透传,同时对应用服务器进行重启或者重构,在恢复业务功能之后再进行原来的业务流程,从而有效降低了电信网络中的应用服务器异常对现网和用户感受所造成的负面影响。附图说明图1是本专利技术一种应用服务器可靠性的检测系统的组成结构示意图。图2是检测装置的组成结构示意图。图3是硬件检测单元的组成结构示意图。图4是硬件检测中,检测周期的时长根据应用服务器的业务指标和设备指标动态调整的流程图。图5是业务检测中,检测周期的时长根据模拟现有业务流程出现的错误情况动态调整的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。如图1所示,本专利技术一种应用服务器可靠性的检测系统,应用服务器内部包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,不再对应用服务器接收到的外部消息进行透传,而是将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常;其他装置,用于实现应用服务器的业务功能。如图2所示,检测装置进一步包括有:硬件检测单元,用于接收应用服务器内部的其他装置发送来的心跳消息,当在一个检测周期内未收到其中一个或多个其他装置发来的心跳消息时,则向接入前置模块发送服务器异常通知消息;业务检测单元,用于模拟现有业务流程,并判断在一个检测周期内业务流程运行后的结果是否正常,如果否,则向接入前置模块发送服务器异常通知消息,并填写错误日志。硬件检测单元中,检测周期的时长还可以根据应用服务器的业务指标和设备指标来动态调整,如图3所示,硬件检测单元进一步包括有:业务指标读取部件,用于获取应用服务器在当前检测周期T、以及与当前检测周期相邻的上一检测周期T'内的若干业务指标,所述业务指标可以包括但不限于:任务量、处置量、黑名单量、白名单量、灰名单量;设备指标读取部件,分别获取应用服务器在当前检测周期T、以及上一检测周期T'内的若干设备指标期望值及其上限值,所述设备指标期望值及其上限值可以包括但不限于:CPU期望值及上限值、内存期望值及上限值、硬盘使用率期望值及上限值、I/O期望值及上限值;业务运行矩阵构建部件,用于根据应用服务器在当前检测周期T、以及上一检测周期T'内的业务指标、设备指标期望值及其上限值,分别构建应用服务器在当前检测周期T、以及上一个检测周期T'的业务运行矩阵M(T)、M(T'),其中,mij是M(T)或M(T')中的第i列第j行元素,Vi是应用服务器在T或T'内的第i个业务指标,AVGj是应用服务器在T或T'内的第j个设备指标期望值,Upperj是应用服务器在T或T'内的第j个设备指标上限值,t是当前检测周期的时长,单位为秒,i∈[1,N],j∈[1,M],N是应用服务器的业务指标数,M是应用服务器的设备指标数;硬件周期调整部件,用于计算检测周期的时长变更指数AVGelt:其中,分别是M(T)、M(T')中的第i列第j行元素,并当AVGelt大于1+k时,调整检测周期的时长:其中,t′是调整后的检测周期的时长,k是浮动值,P是可调参数,其值可以根据实际业务需要而设定,例如k=0.1,P=2。业务检测单元中,检测周期的时长还可以根据模拟现有业务流程出现的错误情况而动态调整,业务检测单元进一步包括有:业务周期调整部件,用于从错误日志中读取模拟业务流程运行中出现的错误数及对应的错误级别,然后调整检测周期的时长:其中,t′是调整后的检测周期的时长,t是当前检测周期的时长,wf是第f级错误级别的权重,可以根据实际业务需要而设定,sf是模拟业务流程运行中出现的第f级错误级别的错误数,F是错误级别数。接入前置装置进一步包括有:消息透传单元,用于将应用服务器接收到的所有外部消息的目的地址、和其SIP协议中RequestURI字段的目的地址都修改为业务下一跳的IP地址,然后将修改后的消息发送出去。消息透传单元针对IP层将收到的所有IP包的目的地址转换为业务下一跳的IP地址,这样所有IP包在应用服务器发生异常时可以直接透传,并直接建立业务前一跳与下一跳的连接关系,之后也无需对每个IP包都进行转发;同时,针对SIP协议消息,将RequestURI字段中的目的地址修改为业务下一跳的IP地址,这样SIP协议中也会直接将前一跳与下一跳连接,直到下一个呼叫本文档来自技高网...

【技术保护点】
1.一种应用服务器可靠性的检测系统,其特征在于,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常。

【技术特征摘要】
1.一种应用服务器可靠性的检测系统,其特征在于,应用服务器包含有:接入前置装置,用于当接收到检测装置发送来的服务器异常通知消息时,将服务器异常通知消息转发给自愈装置,同时,将应用服务器接收到的所有外部消息进行消息透传;当接收到自愈装置返回的自愈完成消息时,将应用服务器接收到的所有外部消息按现有业务流程进行处理;检测装置,用于按一定的时长间隔,检测应用服务器内部是否发生异常,当检测到应用服务器发生异常时,向接入前置装置发送服务器异常通知消息;自愈装置,用于当接收到接入前置装置发送来的服务器异常通知消息时,对应用服务器进行重启或者重构,并在完成后,向接入前置模块返回自愈完成消息,以通知接入前置装置应用服务器恢复正常。2.根据权利要求1所述的系统,其特征在于,检测装置进一步包括有:硬件检测单元,用于接收应用服务器内部的其他装置发送来的心跳消息,当在一个检测周期内未收到其中一个或多个其他装置发来的心跳消息时,则向接入前置模块发送服务器异常通知消息;业务检测单元,用于按一定的时长间隔,模拟现有业务流程运行,并判断业务流程运行后的结果是否正常,如果否,则向接入前置模块发送服务器异常通知消息,并填写错误日志。3.根据权利要求2所述的系统,其特征在于,硬件检测单元进一步包括有:业务指标读取部件,用于获取应用服务器在当前检测周期T、以及与当前检测周期相邻的上一检测周期T'内的若干业务指标,所述业务指标包括但不限于:任务量、处置量、黑名单量、白名单量、灰名单量;设备指标读取部件,分别获取应用服务器在当前检测周期T、以及上一检测周期T'内的若干设备指标期望值及其上限值,所述设备指标期望值及其上限值包括但不限于:CPU期望值及上限值、内存期望值及上限值、硬盘使用率期望值及上限值、I/O期望值及上限值;业务运行矩阵构建部件,用于根据应用服务器在当前检测周期T、以及上一检测周期T'内的业务指标、设备指标期望值及其上限值,分别构建应用服务器在当前检测周期T、以及上一个检测周期T'的业务运行矩阵M(T)、M(T'),其中,mij是M(T)或M(T')中的第i列第j行元素,Vi是应用服务器在T或T'内的第i个业务指标,AVGj是应用服务器在T或T'内的第j个设备指标期望值,Upperj是应用服务器在T或T'内的第j个设备指标上限值,t是当前检测周期的时长,单位为秒,i∈[1,N],j∈[1,M],N是应用服务器的业务指标数,M是应用服务器的设备指标数;硬件周期调整部件,用于计算检测周期的时长变更指数AVGelt:其中,分别是M(T)、M(T')中的第i列第j行元素,并当AVGelt大于1+k时,调整检测周期的时长:其中,t'是调整后的检测周期的时长,k是浮动值,P是可调参数。4.根据权利要求2所述的系统,其特征在于,业务检测单元进一步包括有:业务周期调整部件,用于从错误日志中读取模拟业务流程运行中出现的错误数及对应的错误级别,然后调整检测周期的时长:其中,t是调整后的检测周期的时长,t是当前检测周期的时长,wf是第f级错误级别的权重,sf是模拟业务流程运行中出现的第f级错误级别的错误数,F是错误级别数。5.根据权利要求1所述的系统,其特征在于,接入前置装置进一步包括有:消息透传单元,用于将应用...

【专利技术属性】
技术研发人员:万辛李鹏安茂波董博谦陈杰沈亮王昭王方青高旭
申请(专利权)人:国家计算机网络与信息安全管理中心杭州东信北邮信息技术有限公司长安通信科技有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1