一种检测业务故障的方法、装置和系统及设备制造方法及图纸

技术编号:9279312 阅读:130 留言:0更新日期:2013-10-25 00:24
本发明专利技术涉及通信领域技术,尤其涉及检测业务故障的方法、装置和系统及设备,该方法包括从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。使用本发明专利技术实施例提供的检测业务故障的方法、装置和系统及设备,能够及时发现业务处理机的故障,提高故障检测的准确性,避免向发生故障的业务处理机分配而带来的业务损失。

【技术实现步骤摘要】
一种检测业务故障的方法、装置和系统及设备
本专利技术涉及通信领域技术,尤其涉及一种检测业务故障的方法、装置和系统及设备。
技术介绍
目前,为了避免多机集群系统中某个业务处理机发生故障时的损失业务量,一般情况下,在多机集群中部署负载均衡设备,并在负载均衡设备中配置健康检查功能。实现该健康检查功能时,一般是以检测每个业务处理机的服务端口存活情况为依据。在按照一定探测策略后判断端口异常,负载均衡设备不再向该业务处理机分配消息配额,则因该单机故障引起的业务损失会被降到最低。但是,现有技术中存在一个潜在漏洞,当多机集群系统中某一个业务处理机的服务端口正常,但是其内部处理逻辑或与其他外部网元的链接异常等导致业务受阻时,负载均衡设备无法判断该业务处理机工作异常,负载均衡设备会继续给其分配消息配额,造成业务损失。
技术实现思路
本专利技术实施例提供了一种检测业务故障的方法、装置和系统及设备,可以提高故障检测的准确性,避免向发生故障的业务处理机分配而带来的业务损失。本专利技术实施例提供了一种检测业务故障的方法,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。相应的,本专利技术实施例提供了一种检测业务故障的装置,包括:获取模块,用于从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断模块,用于判断所述第一参数值和第二参数值是否满足隔离条件;隔离模块,用于当满足隔离条件时,隔离所述业务处理机;通知模块,用于当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。相应的,本专利技术实施例提供了一种设备,包括:上述检测业务故障的装置。相应的,本专利技术实施例提供了一种检测业务故障的系统,包括:业务处理机、与所述业务处理机对应的操作维护子系统、前台业务子系统和负载均衡设备;其中,所述操作维护子系统从所述业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知所述负载均衡设备为所述业务处理机分配业务消息配额。本专利技术实施例提供了一种检测业务故障的方法、装置和系统及设备,用于从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。使用本专利技术实施例提供的检测业务故障的方法、装置和系统及设备,通过分析业务处理机接收信息和转发信息的能力,确定业务处理机是否应该被隔离,本专利技术实施例提供的方案更为贴近业务处理机的实际处理业务能力,能够及时发现业务处理机的故障,提高故障检测的准确性,避免向发生故障的业务处理机分配而带来的业务损失。而且,还可以及时检测到业务处理机恢复正常工作,实现了快速隔离、快速恢复的功能。并且,本专利技术实施例提供的方案对现有的系统的物理结构改造小,进一步的节约了实现成本。附图说明图1为本专利技术实施例中检测业务故障的方法流程示意图;图2为本专利技术实施例中判断是否满足隔离条件的方法流程示意图;图3为本专利技术实施例中隔离业务处理机的方法流程示意图;图4为本专利技术实施例中恢复业务处理机的方法流程示意图;图5为本专利技术另一实施例中检测业务故障的装置示意图;图6为本专利技术另一实施例中检测业务故障的系统示意图。具体实施方式下面结合各个附图对本专利技术实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。为了解决现有技术存在的问题,本专利技术实施例提供了一种检测业务故障的方法,如图1所示,该方法包括:步骤101、从业务处理机对应的前台业务子系统,获取业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;步骤102、判断第一参数值和第二参数值是否满足隔离条件,若是执行步骤103;否则,执行步骤104;步骤103、当满足隔离条件时,隔离业务处理机;步骤104、当不满足隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。在多机集群方式部署的业务系统中(如彩信网关集群系统、彩信中心、短信中心等),为业务处理机分配业务消息配额的负载均衡设备仅能通过业务处理机的服务端口的存活情况判断业务处理机的工作状态,而当业务处理机内部处理逻辑等异常时,无法检测到工作状态异常。本专利技术实施例提供的方法从业务处理机自身的业务特别出发,通过对接收信息能力和转发信息能力的检测判断业务处理机的工作状态是否正常。首先,业务处理机对应的操作维护子系统周期性从业务处理机对应的前台业务子系统的业务前台,获取业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;其中,第一参数值包括接收消息量和成功接收消息量,第二参数值包括转发消息量和成功转发消息量。具体的,现有技术中操作维护子系统存在性能统计功能,该功能实现时从业务前台获取有关业务数据,例如接收消息量、成功接收消息、转发消息量和成功转发消息量等。现有技术中,这些业务数据用于供用户查看。本专利技术实施例中,通过创造性的劳动,对该功能进行了改进,增加了一些功能,即周期性从业务处理机对应的前台业务子系统的业务前台,获取业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值。例如,周期性从业务处理机对应的前台业务子系统的业务前台,获取业务处理机从当前时间至当前时间的前5分钟内的成功接收消息量以及转发消息量。较佳的,表征接收信息能力的第一参数值选用成功接收消息量,表征转发信息能力的第二参数值选用转发消息量。因为这两个参数表征的意义最为贴近业务处理机工作状况。例如,业务处理机5分钟内转发100条消息,但是由于接收消息的对端发生故障,仅有50条消息成功转发,此时若第二参数值选用成功转发消息量,则偏离了业务处理机的真实工作状态。然后,业务处理机对应的操作维护子系统,根据该第一参数值和第二参数值,判断是否应该隔离当前的业务处理机。其中,需要判断第一参数值和第二参数值是否满足隔离条件。a)该隔离条件为第二参数值与第一参数值的比值小于预定隔离阈值时,从业务处理机对应的前台业务子系统,获取业务处理机在同一时间段内的第二参数值和第一参数值的比值;将比值与所述预定隔离阈值进行比较;其中,比值小于预定隔离阈值时,满足隔离条件,隔离业务处理机;比值不大于预定隔离阈值时,不满足隔离条件,通知负载均衡设备向业务处理机分配业务消息配额。b)该隔离条件为第二参数值与第一参数值的比值小于预定隔离阈值,且比值小于前N次获取的所述比值,其中N为大于等于1的正整数时,从业务处理机对应的前台业务子系统,获取业务处理机在同一时间段内的第二参数值和第一参本文档来自技高网...
一种检测业务故障的方法、装置和系统及设备

【技术保护点】
一种检测业务故障的方法,其特征在于,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额。

【技术特征摘要】
1.一种检测业务故障的方法,其特征在于,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断所述第一参数值和第二参数值是否满足隔离条件;当满足隔离条件时,隔离所述业务处理机;当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额;其中,在所述隔离条件为以下之一时,所述方法还包括:所述隔离条件为所述第二参数值与所述第一参数值的比值小于预定隔离阈值时,判断所述第一参数值和第二参数值是否满足隔离条件,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的第二参数值和第一参数值的比值;将所述比值与所述预定隔离阈值进行比较;其中,所述比值小于所述预定隔离阈值时,满足所述隔离条件,隔离所述业务处理机;所述比值不小于所述预定隔离阈值时,不满足所述隔离条件,通知负载均衡设备向所述业务处理机分配业务消息配额;所述隔离条件为所述第二参数值与所述第一参数值的比值小于预定隔离阈值,且所述比值小于保存的前N次获取的所述比值,其中N为大于等于1的正整数时,判断所述第一参数值和第二参数值是否满足隔离条件,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的第二参数值和第一参数值的比值;将所述比值与所述预定隔离阈值进行比较;所述比值小于所述预定隔离阈值时,将当前比值与前N次获取的比值分别进行比较;当比较结果均为小于时,满足所述隔离条件,隔离所述业务处理机;当比较结果未均为小于时,不满足所述隔离条件,通知负载均衡设备向所述业务处理机分配业务消息配额。2.如权利要求1所述的方法,其特征在于,周期性从所述业务处理机对应的前台业务子系统的业务前台,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;其中,所述第一参数值包括接收消息量和成功接收消息量,所述第二参数值包括转发消息量和成功转发消息量。3.如权利要求2所述的方法,其特征在于,周期性从所述业务处理机对应的前台业务子系统的业务前台,获取所述业务处理机从当前时间至当前时间的前5分钟内的成功接收消息量以及转发消息量。4.如权利要求1所述的方法,其特征在于,所述隔离所述业务处理机,包括:发出隔离提示消息并在接收到隔离指令时,向所述业务处理机对应的前台业务子系统发送隔离调用命令;所述前台业务子系统调用隔离程序,对所述业务处理机与对应的负载均衡设备之间的服务端口号进行修改或关闭,并重启;所述负载均衡设备探测到所述服务端口号修改或关闭时,停止向所述业务处理机分配消息配额。5.如权利要求4所述的方法,其特征在于,还包括:通过互联网向指定地址发送提醒邮件或提醒短信。6.如权利要求1所述的方法,其特征在于,隔离所述业务处理机之后,还包括:当所述业务处理机不满足所述隔离条件时,发出恢复提示消息并在接收到恢复指令时,向所述业务处理机对应的前台业务子系统发送恢复调用命令;所述前台业务子系统调用恢复程序,将所述业务处理机与对应的负载均衡设备之间的服务端口号修改为可用服务端口号,并重启;所述负载均衡设备探测到所述服务端口号可用时,向所述业务处理机分配业务消息配额。7.一种检测业务故障的装置,其特征在于,包括:获取模块,用于从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的表征接收信息能力的第一参数值和表征转发信息能力的第二参数值;判断模块,用于判断所述第一参数值和第二参数值是否满足隔离条件;隔离模块,用于当满足隔离条件时,隔离所述业务处理机;通知模块,用于当不满足所述隔离条件时,通知负载均衡设备为所述业务处理机分配业务消息配额;其中,在所述隔离条件为以下之一时,所述装置还包括:所述隔离条件为所述第二参数值与所述第一参数值的比值小于预定隔离阈值时,判断所述第一参数值和第二参数值是否满足隔离条件,包括:从业务处理机对应的前台业务子系统,获取所述业务处理机在同一时间段内的第二参数值和第一参数值的比值;将所述比值与所述预定隔离阈值进行比较;其中,所述比值小于所述预定隔离阈值时,满足所述隔离条件,隔离所述业务处理机;所述比值不小于所述预定隔离阈值时,不满足所述隔离条件,通知负载均衡设备向所述业务处理机分配业务消息配额;所述隔离条件为所述第二参数值与所述第一参数值的比值小于预定隔离阈值,且所述比值小于保存的前N...

【专利技术属性】
技术研发人员:王国才张浩军
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1