一种故障确定方法及装置制造方法及图纸

技术编号:37139600 阅读:13 留言:0更新日期:2023-04-06 21:43
本申请公开了一种故障确定方法,包括:获取第一服务的第一请求处理结果,第一请求处理结果用于指示与第一服务相关的请求的处理结果。若第一请求处理结果指示第一设备处理失败的、与第一服务相关的请求的第一数量符合第一条件,则可以初步判断第一设备可能存在故障。为进一步确定第一设备是否确实存在故障,可以获取第一设备上部署的第二服务的第二请求处理结果,并进一步基于第二请求处理结果确定第一设备存在故障。由于第一设备故障,直接会影响到在第一设备上部署的服务的处理结果,因此,本方案结合第一设备针对第一服务和第二服务的请求处理结果来确定第一设备存在故障,可以准确的确定第一设备存在故障。以准确的确定第一设备存在故障。以准确的确定第一设备存在故障。

【技术实现步骤摘要】
一种故障确定方法及装置


[0001]本申请涉及计算机
,特别是涉及一种故障确定方法及装置。

技术介绍

[0002]后端的服务可以部署在物理设备上,具体地,一个物理设备上可以部署多个服务,而一个服务也可以部署在多个物理设备上。例如,服务A可以部署在物理设备1和物理设备2上,物理设备1和物理设备2上除了部署服务A之外,还可以部署其它服务,例如部署服务B。此处提及的服务,可以是客户端对应的服务端。
[0003]如何准确的确定物理设备上部署的服务能否正常运行,是目前急需解决的问题。

技术实现思路

[0004]为了解决或者至少部分解决上述技术问题,本申请实施例提供了一种故障确定方法及装置。
[0005]第一方面,本申请实施例提供了一种故障确定方法,所述方法包括:
[0006]获取第一服务的第一请求处理结果;
[0007]若所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,则获取第二服务的第二请求处理结果,所述第二服务部署在所述第一设备上;
[0008]根据所述第二请求处理结果,确定所述第一设备存在故障。
[0009]可选的,所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,包括:
[0010]所述第一数量与第二数量的比值大于或者等于第一阈值;
[0011]其中,所述第二数量为第一设备集合中的各个设备处理失败的、与所述第一服务相关的请求的总数量,所述第一设备集合中的设备为部署所述第一服务的设备,所述第一设备集合中包括所述第一设备。
[0012]可选的,所述根据所述第二请求处理结果,确定所述第一设备存在故障,包括:
[0013]若所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,则确定所述第一设备存在故障。
[0014]可选的,所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,包括:
[0015]所述第三数量与第四数量的比值大于或者等于第二阈值;
[0016]其中,所述第四数量为第二设备集合中的各个设备处理失败的、与所述第二服务相关的请求的总数量,所述第二设备集合中的设备为部署所述第二服务的设备,所述第二设备集合中包括所述第一设备。
[0017]可选的,所述获取第一服务的第一请求处理结果,包括:
[0018]根据所述第一服务的运行日志,获得所述第一请求处理结果。
[0019]可选的,在获取第二服务的第二请求处理结果之前,所述方法还包括:
[0020]根据所述第一设备的地址,确定所述第一设备上部署的所述第二服务。
[0021]可选的,确定所述第一设备存在故障之后,所述方法还包括:
[0022]输出用于指示所述故障的提示信息。
[0023]第二方面,本申请实施例提供了一种故障确定装置,所述装置包括:
[0024]第一获取单元,用于获取第一服务的第一请求处理结果;
[0025]第二获取单元,用于若所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,则获取第二服务的第二请求处理结果,所述第二服务部署在所述第一设备上;
[0026]第一确定单元,用于根据所述第二请求处理结果,确定所述第一设备存在故障。
[0027]可选的,所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,包括:
[0028]所述第一数量与第二数量的比值大于或者等于第一阈值;
[0029]其中,所述第二数量为第一设备集合中的各个设备处理失败的、与所述第一服务相关的请求的总数量,所述第一设备集合中的设备为部署所述第一服务的设备,所述第一设备集合中包括所述第一设备。
[0030]可选的,所述第一确定单元,用于:
[0031]若所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,则确定所述第一设备存在故障。
[0032]可选的,所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,包括:
[0033]所述第三数量与第四数量的比值大于或者等于第二阈值;
[0034]其中,所述第四数量为第二设备集合中的各个设备处理失败的、与所述第二服务相关的请求的总数量,所述第二设备集合中的设备为部署所述第二服务的设备,所述第二设备集合中包括所述第一设备。
[0035]可选的,所述第一获取单元,用于:
[0036]根据所述第一服务的运行日志,获得所述第一请求处理结果。
[0037]可选的,所述装置还包括:
[0038]第二确定单元,用于在获取第二服务的第二请求处理结果之前,根据所述第一设备的地址,确定所述第一设备上部署的所述第二服务。
[0039]可选的,所述装置还包括:
[0040]输出单元,用于在确定所述第一设备存在故障之后,输出用于指示所述故障的提示信息。
[0041]第三方面,本申请实施例提供了一种设备,所述设备包括处理器和存储器;
[0042]所述处理器用于执行所述存储器中存储的指令,以使得所述设备执行以上第一方面任一项所述的方法。
[0043]第四方面,本申请实施例提供了一种计算机可读存储介质,包括指令,所述指令指示设备执行以上第一方面任一项所述的方法。
[0044]第五方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在
计算机上运行时,使得计算机执行以上第一方面任一项所述的方法。
[0045]与现有技术相比,本申请实施例具有以下优点:
[0046]本申请实施例提供了一种故障确定方法,该方法包括:获取第一服务的第一请求处理结果,所述第一请求处理结果,可以用于指示与第一服务相关的请求的处理结果。若所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,则说明第一设备处理失败的与所述第一服务相关的请求的第一数量较多,此时,可以初步判断第一设备可能存在故障。为进一步确定第一设备是否确实存在故障,可以获取第一设备上部署的第二服务的第二请求处理结果,并进一步基于所述第二请求处理结果确定所述第一设备存在故障。由于第一设备故障,直接会影响到在第一设备上部署的服务的处理结果,因此,本方案结合第一设备针对第一服务和第二服务的请求处理结果来确定第一设备存在故障,可以准确的确定第一设备存在故障。
附图说明
[0047]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障确定方法,其特征在于,所述方法包括:获取第一服务的第一请求处理结果;若所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,则获取第二服务的第二请求处理结果,所述第二服务部署在所述第一设备上;根据所述第二请求处理结果,确定所述第一设备存在故障。2.根据权利要求1所述的方法,其特征在于,所述第一请求处理结果指示第一设备处理失败的、与所述第一服务相关的请求的第一数量符合第一条件,包括:所述第一数量与第二数量的比值大于或者等于第一阈值;其中,所述第二数量为第一设备集合中的各个设备处理失败的、与所述第一服务相关的请求的总数量,所述第一设备集合中的设备为部署所述第一服务的设备,所述第一设备集合中包括所述第一设备。3.根据权利要求1所述的方法,其特征在于,所述根据所述第二请求处理结果,确定所述第一设备存在故障,包括:若所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,则确定所述第一设备存在故障。4.根据权利要求3所述的方法,其特征在于,所述第二请求处理结果指示所述第一设备处理失败的、与所述第二服务相关的请求的第三数量符合第二条件,包括:所述第三数量与第四数量的比值大于或者等于第二阈值;其中,所述第四数量为第二设备集合中的各个设备处理失败的、与所述第二服务...

【专利技术属性】
技术研发人员:吴晨
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1