分布式系统及故障检测方法技术方案

技术编号:20978787 阅读:35 留言:0更新日期:2019-04-29 18:43
本发明专利技术公开了一种分布式系统及故障检测方法,分布式系统包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。本发明专利技术能够快速且清晰地检测通信故障,能够精准监控信息交互系统中各程序间信令交互状态,全面记录系统中信令收发流程,便于开发和运行维护中问题定位。

Distributed System and Fault Detection Method

The invention discloses a distributed system and a fault detection method. The distributed system includes a signaling synchronization server and an information exchange system, which communicates with the signaling synchronization server to send all signaling generated within the information interaction system to the signaling synchronization server so that the signaling synchronization server can communicate with the information interaction system according to the information from the signaling synchronization server. All signaling and the receiving time of each signaling received by the signaling synchronization server are used to detect communication faults in the information exchange system. The invention can detect communication faults quickly and clearly, can accurately monitor the signaling interaction state between programs in the information exchange system, record the signaling transceiver flow in the system comprehensively, and is convenient for problem location in development, operation and maintenance.

【技术实现步骤摘要】
分布式系统及故障检测方法
本专利技术涉及故障检测
,具体涉及一种分布式系统,还涉及用于对该分布式系统中的信息交互系统进行故障检测的方法。
技术介绍
在分布式软件开发和运行维护环节,当出现问题时,当前故障定位方式是查询各服务器日志文件或集中收集日志文件进行对比分析。这种分析需要对各日志文件进行对比,从而找出问题所在,可见,此种方式存在问题定位效率低下、流程不清晰等问题。具体地,假若一个系统包括多个客户端和多个服务程序,其中一个客户端的一个操作导致异常输出或服务之间存在日志报错或服务异常退出情况,当前故障定位方法是复现问题或通过日志进行排查,这种方式需要收集相关日志进行对比分析,从而找出异常现象出现的原因。可见,现有故障定位方法存在以下问题:(1)各服务时间不同步导致日志对比困难或由此引发的异常问题;(2)由于系统不可能为同一人开发,对于流程清晰度将在日志分析过程中产生极大困难,而日志不能完整且完善地反映整个系统的运行流程,这个需要相关人员进行逐步排序,而排序过程一般按照时间排序,从而导致问题(1)所涉及情况的出现;(3)日志完善程度也存在偏差,日志是执行过程和返回结果的一种记录,这种记录的详细程度依赖于开发人员的个人见解,记录格式也依赖于开发人员的个人喜好,从而导致其他开发人员读取对方日志信息时产生较大困难或歧义;(4)由于日志的庞杂性,无论是对日志的分开阅读或集中后阅读,再对照设定的流程图都将耗费大量的人力,特别是一些关键日志的缺失(如开发人员没注意到的细节,没有进行日志输出)将导致灾难性或费力重现后果。基于上述分析,亟需一种能够快速且准确检测故障的分布式系统及故障检测方法。
技术实现思路
为解决上述技术问题,本专利技术提供了一种分布式系统及故障检测方法。根据本专利技术的第一个方面,提供了一种分布式系统,其包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。优选的是,所述信息交互系统包括彼此通信连接的客户端与服务器,所述客户端将发送给服务器的信令和接收的来自所述服务器的信令同步发送给所述信令同步服务器,所述服务器将发送给客户端的信令和接收的来自所述客户端的信令同步发送给所述信令同步服务器。优选的是,所述客户端发送给服务器的信令以及所述服务器发送给客户端的信令均包括发送方、接收方、数据包和信令发送时间;所述客户端接收的来自服务器的信令以及所述服务器接收的来自客户端的信令均包括发送方、接收方、数据包和信令接收时间。优选的是,所信令还包括数据包涉及的参数信息。根据本专利技术的第二个方面,提供了用于对上述分布式系统中的信息交互系统进行故障检测的方法,其包括:信令同步服务器接收来自所述信息交互系统的该信息交互系统内部产生的所有信令,并记录本地接收每个信令的同步端接收时间;所述信令同步服务器基于接收的信令以及每个信令对应的同步端接收时间,构建信令记录表;所述信令同步服务器基于所述信令记录表,检测所述信息交互系统中的通信故障。优选的是,所述信令记录表包括多条记录,每条记录对应一个信令,所述记录包括所述信息交互系统中与该记录对应的信令的发送方与接收方、所述信息交互系统中与该记录对应的信令的发送/接收时间、与该记录对应的信令的数据包以及与该记录对应的信令对应的同步端接收时间。优选的是,所述记录中包括的信令的发送方与接收方、发送/接收时间以及数据包是由所述信令同步服务器从该信令中提取的。优选的是,在所述信令记录表中,各条记录按照信令对应的同步端接收时间排序。优选的是,所述信令同步服务器基于所述信令记录表,检测所述信息交互系统中的通信故障,包括:所述信令同步服务器根据所述信令记录表中的记录,确定所述信息交互系统中设备的实际运行流程;所述信令同步服务器对所述实际运行流程和预设运行流程进行比较;所述信令同步服务器在比较结果指示不一致的情况下,确定所述信息交互系统出现通信故障。优选的是,上述故障检测方法还包括:所述信令同步服务器在确定所述信息交互系统出现通信故障的情况下,根据所述信令记录表中的记录确定所述信息交互系统中出现通信故障的设备。与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:应用本专利技术,能够快速且清晰地检测通信故障,能够精准监控信息交互系统中各程序间信令交互状态,全面记录系统中信令收发流程,便于开发和运行维护中问题定位。附图说明通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范围。其中所包括的附图是:图1示出了根据本专利技术实施例的分布式系统的结构示意图;图2示出了根据本专利技术实施例的用于对分布式系统中的信息交互系统进行故障检测的方法的流程示意图;以及图3示出了本专利技术实施中信令同步服务器基于信令记录表来检测信息交互系统中的通信故障的流程示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下将结合附图及实施例来详细说明本专利技术的实施方法,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。在现有技术中,分布式系统的故障定位方法是复现问题或通过日志进行排查,其通过人工地收集相关日志进行对比分析来找出异常现象出现的原因。可见,现有的故障定位方法存在以下问题:(1)各服务时间不同步导致日志对比困难或由此引发的异常问题;(2)由于系统不可能为同一人开发,对于流程清晰度将在日志分析过程中产生极大困难,而日志不能完整且完善地反映整个系统的运行流程,这个需要相关人员进行逐步排序,而排序过程一般按照时间排序,从而导致问题(1)所涉及情况的出现;(3)日志完善程度也存在偏差,日志是执行过程和返回结果的一种记录,这种记录的详细程度依赖于开发人员的个人见解,记录格式也依赖于开发人员的个人喜好,从而导致其他开发人员读取对方日志信息时产生较大困难或歧义;(4)由于日志的庞杂性,无论是对日志的分开阅读或集中后阅读,再对照设定的流程图都将耗费大量的人力,特别是一些关键日志的缺失(如开发人员没注意到的细节,没有进行日志输出)将导致灾难性或费力重现后果。基于上述分析,亟需一种能够快速且准确检测故障的分布式系统及故障检测方法。实施例一本实施例提供了一种分布式系统。图1示出了根据本专利技术实施例的分布式系统的结构示意图。如图1所示,本专利技术实施例的分布式系统包括信令同步服务器10和信息交互系统20。信令同步服务器10与信息交互系统20通信连接。具体地,信息交互系统20内部包括多个硬件设备,设备之间存在数据交互。信息交互系统20向信令同步服务器10发送该信息交互系统20内部产生的所有信令。举例来说,参照图1,信息交互系统20包括客户端21、第一服务器22、第二服务器23和第二服务器23。客户端21与第一服务器22通信连接,第一服务器22、第二服务器23和第二服务器23两两之间通信连接。具体地,客户端21可以向第一服务器22发送信令,也可以接收来自的第一服务器22的信令。反过来,第一服务器22可以向客户端21发送信令,也可以接收来自客户端21的信令。特别地,客户端21在本文档来自技高网
...

【技术保护点】
1.一种分布式系统,其特征在于,包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。

【技术特征摘要】
1.一种分布式系统,其特征在于,包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。2.根据权利要求1所述分布式系统,其特征在于,所述信息交互系统包括彼此通信连接的客户端与服务器,所述客户端将发送给服务器的信令和接收的来自所述服务器的信令同步发送给所述信令同步服务器,所述服务器将发送给客户端的信令和接收的来自所述客户端的信令同步发送给所述信令同步服务器。3.根据权利要求2所述分布式系统,其特征在于,所述客户端发送给服务器的信令以及所述服务器发送给客户端的信令均包括发送方、接收方、数据包和信令发送时间;所述客户端接收的来自服务器的信令以及所述服务器接收的来自客户端的信令均包括发送方、接收方、数据包和信令接收时间。4.根据权利要求3所述的分布式系统,其特征在于,所述信令还包括数据包涉及的参数信息。5.用于对如权利要求1至4中任一项所述的分布式系统中的信息交互系统进行故障检测的方法,其特征在于,包括:信令同步服务器接收来自所述信息交互系统的该信息交互系统内部产生的所有信令,并记录本地接收每个信令的同步端接收时间;所述信令同步服务器基于接收的信令以及每个信...

【专利技术属性】
技术研发人员:杨亚峰贾屹王立瑾
申请(专利权)人:四川九洲电器集团有限责任公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1