基于分布式系统应用的全链路健康体检方法、终端及介质技术方案

技术编号:37072564 阅读:13 留言:0更新日期:2023-03-29 19:49
本发明专利技术公开了一种基于分布式系统应用的全链路健康体检方法,包括:进行应用血缘分析,得到所有应用的链路解析结果;对链路解析结果进行路径去重;判断是否存在未检测的链路;若是,则从数据库中读取待检测链路;对待检测链路中一条路径的起始应用节点进行健康检查,得到检查结果并记录;判断起始应用节点是否健康;健康则判断当前路径是否存在下一应用节点;判断下一应用节点是否成功接收请求;若成功,判断当前应用节点是否为最后节点;若不存在未检测的链路,从数据库中读取每条链路的各应用节点的检查结果,形成链路健康检查报告。该方法能提高分布式系统健康监测的召回率,降低故障问题漏检的情况,提升健康检查的效率和准确率。准确率。准确率。

【技术实现步骤摘要】
基于分布式系统应用的全链路健康体检方法、终端及介质


[0001]本专利技术涉及数据处理
,具体涉及一种基于分布式系统应用的全链路健康体检方法、终端及介质。

技术介绍

[0002]随着科技与全球经济的发展,我国银行业务发展需要覆盖多元化的业务领域,银行的核心系统需要支持越来越多的信息业务;在内部市场上,互金行业借助金融科技的先发优势在普惠金融、场景金融等方面得到长足的发展。这一系列的变化都在敦促商业银行数字化转型路径。无独有偶,在金融行业高速发展的同时IT技术也随之爆发,其中分布式架构被验证可以有效替代原有的基于大型主机技术构建的集中式架构的核心银行系统。主要表现在以下几个方面:弹性调控的资源配置提升海量业务的处理能力;多节点的高效切换提升了整体系统的可用性,并且分布式技术有着良好的开源社区可以提供大量符合信创要求的优秀基础框架、平台、工具供系统优化升级。
[0003]但是分布式系统在管理上却有着较大的难度,尤其是面对银行的核心系统要做到365天
×
24小时的不间断运行。同时,由于银行经营服务在社会经济运行中的特殊性质,监管部门对银行核心业务系统的稳定运行提出了极其严格的要求。尽管分布式的高可用能力很强,但一旦发生故障,影响范围巨大,这对银行核心系统的可靠性带来巨大的挑战。因此对系统定期的进行健康检查,做到提前预警就显得尤为重要。目前现有技术对分布式系统进行健康检查普遍采用主动模式和被动模式两种,其中被动模式以系统发出的业务请求是否被响应,发起的连接是否成功过作为系统健康的判断依据。而主动模式会定期发起健康检查任务做到提前预警系统中的故障节点、问题数据库、以及应用服务故障、中间件故障、网络故障等。如图1所示,图1为现有技术对分布式系统健康检查的流程图。其中S10

与S20

的具体方法包括心跳检查、下探针、建立长连接等。在金融领域,分布式系统的业务系统健康体检普遍采用集群供应商提供的检查工具对系统进行简单的节点检查、应用检查等。这类工具可通用于各行各业,但又无法针对行业特性、系统各应用间的依赖层面对系统的可用性做更深入的体检。
[0004]当前金融行业对系统可用性的要求越来越高,需要做到事前预警、事中检查、时候修复。然而对于降低损失上来说,事前预警可以避免更多的损失。由于金融系统追求7*24的不间断运行,因此对分布式超大规模的金融系融的健康体检需要做到故障系统、应用、服务等0漏检的程度。目前业界对系统健康检查存在以下问题:1、集群中单节点的心跳测试可以检测出故障节点并消除单点故障,但是这并不意味着而节点所具备的服务响应能力是健康的。2、对中间件进行检测往往只可以探得该中间件是否能正常启动,无法得知该中间件对应用请求行进响应、连接是否正常。3、关于对应用的可用性的验证,当前技术场景更多是对应用是否可以启动做验证,但事实上,交易在分布式系统中往往会发生跨节点的多应用,相互依赖,通常需要调用不同的应用、唤起不同的中间件、连接数据库或者外部库才可以对外提供应用服务能力,其中的任何一个环节出现问题都会影响应用正常服务。当前的检测方
法无法从全链路的角度出发检测链路的健康状况。

技术实现思路

[0005]针对现有技术中的缺陷,本专利技术提供一种基于分布式系统应用的全链路健康体检方法、终端及介质,能提高分布式系统健康监测的召回率,降低故障问题漏检的情况。
[0006]第一方面,本专利技术实施例提供的一种基于分布式系统应用的全链路健康体检方法,包括以下步骤:
[0007]对分布式系统中的应用进行血缘分析,得到所有应用的链路解析结果,并将链路解析结果进行存储,所述链路中至少存在一条路径;
[0008]对链路解析结果进行路径去重,将去重后的路径以链式结构存入数据库;
[0009]判断是否存在未检测的链路;
[0010]若是,则从所述数据库中读取待检测链路;
[0011]接收待检测链路中一条路径的起始应用节点发送的健康检查请求,对所述起始应用节点进行健康检查,得到起始应用节点的检查结果并记录检查结果;
[0012]根据检查结果判断起始应用节点是否健康;
[0013]若不健康,则结束当前链路的检查,进行下一条链路的健康检查;
[0014]若健康,则判断待检测链路中当前路径是否存在下一应用节点;
[0015]若存在,则当前应用节点发送健康检查请求到下一应用节点;
[0016]判断下一应用节点是否成功接收请求;
[0017]若成功,则判断当前应用节点是否为最后节点;
[0018]若是,则返回执行判断是否存在未检测的链路;
[0019]若不是,则进行健康检查,并记录当前应用节点的检查结果;
[0020]若失败,则记录接收失败的应用节点与前一应用节点间的路径异常信息,后续节点不进行检查;
[0021]若否,则从数据库中读取每条链路的各应用节点的检查结果,形成链路健康检查报告。
[0022]第二方面,本专利技术实施例提供的一种智能终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述实施例描述的方法。
[0023]第三方面,本专利技术实施例提供的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述实施例描述的方法。
[0024]本专利技术的有益效果:
[0025]本专利技术公开的一种基于分布式系统应用的全链路健康体检方法、终端及介质,能提高分布式系统健康监测的召回率,降低故障问题漏检的情况,全程无需人工干预,提升健康检查的效率和准确率。
附图说明
[0026]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0027]图1示出了现有技术对分布式系统健康检查的流程图;
[0028]图2示出了本专利技术第一实施例提供的一种基于分布式系统应用的全链路健康体检方法的流程图;
[0029]图3示出了本专利技术第一实施例中的对分布式系统中的应用进行血缘分析的示意图;
[0030]图4示出了本专利技术另一实施例提供的智能终端的结构示意图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式系统应用的全链路健康体检方法,其特征在于,包括以下步骤:对分布式系统中的应用进行血缘分析,得到所有应用的链路解析结果,并将链路解析结果进行存储,所述链路中至少存在一条路径;对链路解析结果进行路径去重,将去重后的路径以链式结构存入数据库;判断是否存在未检测的链路;若是,则从所述数据库中读取待检测链路;接收待检测链路中一条路径的起始应用节点发送的健康检查请求,对所述起始应用节点进行健康检查,得到起始应用节点的检查结果并记录检查结果;根据检查结果判断起始应用节点是否健康;若不健康,则结束当前链路的检查,进行下一条链路的健康检查;若健康,则判断待检测链路中当前路径是否存在下一应用节点;若存在,则当前应用节点发送健康检查请求到下一应用节点;判断下一应用节点是否成功接收请求;若成功,则判断当前应用节点是否为最后节点;若是,则返回执行判断是否存在未检测的链路;若不是,则进行健康检查,并记录当前应用节点的检查结果;若失败,则记录接收失败的应用节点与前一应用节点间的路径异常信息,后续节点不进行检查;若否,则从数据库中读取每条链路的各应用节点的检查结果,形成链路健康检查报告。2.如权利要求1所述的方法,其特征在于,所述对分布式系统中的应用进行血缘分析的具体方法包括:查询和统计分布式系统中所有的应用的相关信息,所述相关信息包括应用数量和应用名称;以其中一个应用节点作为起始节点,查询起始节点为首节点的业务交易所涉及到的所有后续应用节点间的依赖关系,以此类推,直至所有应用均被...

【专利技术属性】
技术研发人员:张俊邢星刘金华刘子煌单晓晨
申请(专利权)人:维恩贝特科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1