【技术实现步骤摘要】
一种故障定位的方法、装置、存储介质及电子设备
[0001]本申请涉及计算机领域,特别涉及一种故障定位的方法、装置、存储介质及电子设备。
技术介绍
[0002]随着互联网技术和数字化经济的不断发展,各行业的业务形态逐渐互联网化,发展至今,各行业业务数量已极其庞大。
[0003]由于各行业业务逐渐互联网化,业务的执行效率提高的同时,在执行过程中难免会出现错误,比如交易付款业务付款失败,或转账业务钱款未到账等。导致业务执行失败的原因很有可能是执行业务的系统指标出现了异常,例如,执行业务的系统的中央处理器(Central Processing Unit,CPU)使用率过高、内存使用率过高、传输控制协议(Transmission Control Protocol,TCP)连接数过多等等。
[0004]当业务执行失败时,及时地定位其失败的根本原因可以更好的解决问题,所以能否准确定位其失败的根本原因对提供业务的服务商而言是一个重要的问题,现有技术可以定位到业务执行失败的故障源,故障源可以是用于执行业务的容器、虚拟机、硬件设 ...
【技术保护点】
【技术特征摘要】
1.一种故障定位的方法,所述方法应用于在业务系统发生故障时,定位所述业务系统中故障源的根因指标;所述方法包括:获取所述业务系统发生故障时,所述故障源的各状态指标;将所述各状态指标输入预先训练的拟合模型,以使模型对输入的所述各状态指标进行拟合,作为第一拟合过程,获得所述拟合模型输出的执行失败的业务的数目,作为第一数目;针对每个状态指标,将该状态指标作为目标指标,将除该目标指标之外的其他状态指标作为非目标指标;将各非目标指标输入所述拟合模型,以使模型对输入的各非目标指标进行拟合,作为第二拟合过程,获得所述拟合模型输出的执行失败的业务的数目,作为第二数目;根据所述第一数目与所述第二数目,以及所述拟合模型中的各层在所述第一拟合过程与所述第二拟合过程中输出的特征,确定所述目标指标对所述第一拟合过程的贡献度,作为所述目标指标的贡献度;根据所述各状态指标的贡献度,在各状态指标中定位所述故障源的根因指标。2.如权利要求1所述的方法,所述各状态指标包括CPU使用率、内存使用率、流量、TCP连接数中的至少一种。3.如权利要求1所述的方法,预先训练拟合模型,具体包括:预先确定所述业务系统在历史上发生故障时的历史故障源;获取所述历史故障源在历史上发生故障时的各历史状态指标,并确定所述业务系统在历史上发生故障时执行失败的业务的实际数目,将所述各历史状态指标作为训练样本,将所述实际数目作为所述训练样本对应的标注;将训练样本输入待训练拟合模型,以使模型对输入的所述各历史状态指标进行拟合,获得所述待训练拟合模型输出的执行失败的业务的数目,作为预测数目;以所述预测数目与所述标注的差异最小为训练目标,对待训练拟合模型进行训练,得到拟合模型。4.如权利要求1所述的方法,根据所述第一数目与所述第二数目,以及所述拟合模型中的各层在所述第一拟合过程与所述第二拟合过程中输出的特征,确定所述目标指标对所述第一拟合过程的贡献度,具体包括:将所述第一数目与所述第二数目的差值作为所述拟合模型的最后一层的反向传播值;将所述拟合模型的最后一层作为待传播层;根据所述拟合模型中所述待传播层的上一层在所述第一拟合过程和所述第二拟合过程中输出的特征,确定所述上一层的传播系数;根据所述待传播层的反向传播值和所述上一层的传播系数,计算所述上一层的反向传播值;将所述上一层重新作为待传播层,并计算重新确定的待传播层的上一层的反向传播值,直至所述上一层为所述拟合模型的第一层时,将所述第一层的反向传播值作为所述目标指标对所述第一拟合过程的贡献度。5.如权利要求1或4所述的方法,所述拟合模型至少包括层数为两层的多层感知机。6.如权利要求4所述的方法,根据所述拟合模型中所述待传播层的上一层在所述第一
拟合过程和所述第二拟合过程中输出的特征,确定所述上一层的传播系数,具体包括:根据所述拟合模型中所述待传播层的上一层的每个节点在所述第一拟合过程中输出的特征,与所述上一层的所有节点在所述第二拟合过程中输出的特征的期望,确定所述上一层的传播系数。7.如权利要求1所述的方法,根据所述各状态指标的贡献度,在各状态指标中定位所述故障源的根因指标,具体包括:比较所述各状态指标的贡献度的大小;将贡献度最大的状态指标定位为所述故障源的根因指标。8.一种故障定位的装置,所述装置...
【专利技术属性】
技术研发人员:雷志超,陈超宇,余航,李建国,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。