The invention discloses a distributed system and a fault detection method. The distributed system includes a signaling synchronization server and an information exchange system, which communicates with the signaling synchronization server to send all signaling generated within the information interaction system to the signaling synchronization server so that the signaling synchronization server can communicate with the information interaction system according to the information from the signaling synchronization server. All signaling and the receiving time of each signaling received by the signaling synchronization server are used to detect communication faults in the information exchange system. The invention can detect communication faults quickly and clearly, can accurately monitor the signaling interaction state between programs in the information exchange system, record the signaling transceiver flow in the system comprehensively, and is convenient for problem location in development, operation and maintenance.
【技术实现步骤摘要】
分布式系统及故障检测方法
本专利技术涉及故障检测
,具体涉及一种分布式系统,还涉及用于对该分布式系统中的信息交互系统进行故障检测的方法。
技术介绍
在分布式软件开发和运行维护环节,当出现问题时,当前故障定位方式是查询各服务器日志文件或集中收集日志文件进行对比分析。这种分析需要对各日志文件进行对比,从而找出问题所在,可见,此种方式存在问题定位效率低下、流程不清晰等问题。具体地,假若一个系统包括多个客户端和多个服务程序,其中一个客户端的一个操作导致异常输出或服务之间存在日志报错或服务异常退出情况,当前故障定位方法是复现问题或通过日志进行排查,这种方式需要收集相关日志进行对比分析,从而找出异常现象出现的原因。可见,现有故障定位方法存在以下问题:(1)各服务时间不同步导致日志对比困难或由此引发的异常问题;(2)由于系统不可能为同一人开发,对于流程清晰度将在日志分析过程中产生极大困难,而日志不能完整且完善地反映整个系统的运行流程,这个需要相关人员进行逐步排序,而排序过程一般按照时间排序,从而导致问题(1)所涉及情况的出现;(3)日志完善程度也存在偏差,日志是执行过程和返回结果的一种记录,这种记录的详细程度依赖于开发人员的个人见解,记录格式也依赖于开发人员的个人喜好,从而导致其他开发人员读取对方日志信息时产生较大困难或歧义;(4)由于日志的庞杂性,无论是对日志的分开阅读或集中后阅读,再对照设定的流程图都将耗费大量的人力,特别是一些关键日志的缺失(如开发人员没注意到的细节,没有进行日志输出)将导致灾难性或费力重现后果。基于上述分析,亟需一种能够快速且准确检测故障的 ...
【技术保护点】
1.一种分布式系统,其特征在于,包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。
【技术特征摘要】
1.一种分布式系统,其特征在于,包括:信令同步服务器;以及信息交互系统,其与所述信令同步服务器通信连接,以向所述信令同步服务器发送该信息交互系统内部产生的所有信令,以使所述信令同步服务器根据来自所述信息交互系统的所有信令以及各个信令被所述信令同步服务器接收的同步端接收时间来检测所述信息交互系统中的通信故障。2.根据权利要求1所述分布式系统,其特征在于,所述信息交互系统包括彼此通信连接的客户端与服务器,所述客户端将发送给服务器的信令和接收的来自所述服务器的信令同步发送给所述信令同步服务器,所述服务器将发送给客户端的信令和接收的来自所述客户端的信令同步发送给所述信令同步服务器。3.根据权利要求2所述分布式系统,其特征在于,所述客户端发送给服务器的信令以及所述服务器发送给客户端的信令均包括发送方、接收方、数据包和信令发送时间;所述客户端接收的来自服务器的信令以及所述服务器接收的来自客户端的信令均包括发送方、接收方、数据包和信令接收时间。4.根据权利要求3所述的分布式系统,其特征在于,所述信令还包括数据包涉及的参数信息。5.用于对如权利要求1至4中任一项所述的分布式系统中的信息交互系统进行故障检测的方法,其特征在于,包括:信令同步服务器接收来自所述信息交互系统的该信息交互系统内部产生的所有信令,并记录本地接收每个信令的同步端接收时间;所述信令同步服务器基于接收的信令以及每个信...
【专利技术属性】
技术研发人员:杨亚峰,贾屹,王立瑾,
申请(专利权)人:四川九洲电器集团有限责任公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。