基于指标数据和日志数据的异常根因获得方法及系统技术方案

技术编号:39649825 阅读:9 留言:0更新日期:2023-12-09 11:18
本发明专利技术提供一种基于指标数据和日志数据的异常根因获得方法,包括:

【技术实现步骤摘要】
基于指标数据和日志数据的异常根因获得方法及系统


[0001]本专利技术涉及智能运维领域,尤其涉及一种基于指标数据和日志数据的异常根因获得方法及系统


技术介绍

[0002]互联网的快速发展使得微服务系统的规模

复杂度急剧膨胀

大部分互联网企业的运维手段过于单一,仍停留在人工分析为主的阶段

传统人工分析的运维方式逐渐落后,无法解决涉及大规模

高复杂度的问题

[0003]近年来,随着人工智能领域的发展,数据驱动的自动化算法成功在多种复杂场景中应用,这也为解决这些问题提供了契机

数据驱动的自动化算法的基础是数据,对于微服务系统来说日志和指标是运维可观测性的重要组成部分

日志是微服务系统异常检测的重要数据来源,记录了微服务系统运行期间详细的运行信息,以及一个事件的时间戳

涉及的方法及参数等

通过检查日志能够帮助维护管理人员了解系统的行为并发现可能的异常信息

系统运行指标是定时采集的时序数据,例如
CPU
使用率

相应延迟等

常采集到的指标是(时间戳,值)的形式

当数值呈现出异常时,例如出现突增突降等,意味着与之相关的微服务发生了一些异常,需要运维人员及时进行根因定位并采取有效措施

[0004]但是现有的自动化检测方法也存在着仅适用于指标层面的微服务系统根因,仅适用于日志告警问题的根因分析,日志数据与指标数据的因果分析未考虑日志运行过程中的异常属性等问题


技术实现思路

[0005]为解决上述技术问题,本专利技术提供一种基于指标数据和日志数据的异常根因获得方法,包括:
S1
:获取微服务系统的指标数据和日志数据;
S2
:通过
BIRCH
聚类算法计算获得指标数据的指标异常分数序列集合
MASS

S3
:通过
DeepLog
算法计算获得日志数据的日志异常分数序列
LAS

S4
:将指标异常分数序列集合
MASS
中的每个指标数据的聚类结果与日志异常分数序列
LAS
进行关联度分析,获得关联度;
S5
:通过关联度排序获得异常根因指标

[0006]优选的,步骤
S2
具体为:
S21
:对获得的
N
条指标数据进行归一化处理,将指标数据转化为
[0,1]范围内的指标向量
M={m1,m2,...,m
N
}

S22
:通过
BIRCH
聚类算法对指标向量
M
中的每个指标数据
m
u
分别进行聚类,将各指标数据的聚类结果集合作为指标异常分数序列集合
MASS={MAS1,MAS2,...,MAS
N
}
,其中
MAS
u
为第
u
个指标数据的聚类结果,
u
的取值范围为1至
N。
[0007]优选的,步骤
S3
具体为:
S31
:将日志数据按照日志类别解析为日志键序列和参数向量序列;
S32
:基于
DeepLog
分析日志键序列,获得日志键异常分数序列
LAS
t

S33
:基于
DeepLog
分析参数向量序列,获得参数向量异常分数序列
LAS
p

S34
:通过日志键异常分数序列
LAS
t
和参数向量异常分数序列
LAS
p
,计算获得日志数据的日志异常分数序列
LAS。
[0008]优选的,步骤
S32
具体为:
S321
:设置第一时间窗口,获取日志键序列在第一时间窗口内的日志键集合
window
h
={k
h

H
,k
h

H+1
,...,k
h
}
,其中,
h
为时刻,
H
为第一时间窗口的长度,
k
h
为第
h
个日志键;通过
Deeplog
预测日志键集合在
h+1
时刻的日志键
k
h+1

S322
:通过标准多项式逻辑函数计算获得日志键
k
h+1
的概率分布集合
P={k1:p1,k2:p2,...,k
i
:p
i
,...,k
g
:p
g
}
,其中,
i
为日志键的编号,
p
i
表示日志键
k
h+1
为日志键
k
i
的概率,
g
为日志键种类个数;
S323
:若
h+1
时刻的日志键的真实日志键为
k
i
,且
p
i
小于设置的阈值
Threshold
,则判断日志发生了执行路径异常,令
h+1
时刻的日志键异常分数
AS
th
=Threshold

p
i
;若
p
i
不小于
Threshold
则判断日志正常,令
h+1
时刻的日志键异常分数
AS
th
=0

S324
:令
h=h+1

S325
:重复步骤
S321

S324
,通过日志键序列中所有日志键的异常分数,构建日志键异常分数序列
LAS
t

[0009]优选的,步骤
S33
具体为:
S331
:设置第二时间窗口,获取参数向量序列在第二时间窗口内的参数向量集合
e
q
={v
q

Q
,v
q

Q+1
,...,v
q
}
,其中,
q
为参数向量的编号,
Q
为第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于指标数据和日志数据的异常根因获得方法,其特征在于,包括:
S1
:获取微服务系统的指标数据和日志数据;
S2
:通过
BIRCH
聚类算法计算获得指标数据的指标异常分数序列集合
MASS

S3
:通过
DeepLog
算法计算获得日志数据的日志异常分数序列
LAS

S4
:将指标异常分数序列集合
MASS
中的每个指标数据的聚类结果与日志异常分数序列
LAS
进行关联度分析,获得关联度;
S5
:通过关联度排序获得异常根因指标
。2.
根据权利要求1所述的基于指标数据和日志数据的异常根因获得方法,其特征在于,步骤
S2
具体为:
S21
:对获得的
N
条指标数据进行归一化处理,将指标数据转化为
[0,1]
范围内的指标向量
M={m1,m2,...,m
N
}

S22
:通过
BIRCH
聚类算法对指标向量
M
中的每个指标数据
m
u
分别进行聚类,将各指标数据的聚类结果集合作为指标异常分数序列集合
MASS={MAS1,MAS2,...,MAS
N
}
,其中
MAS
u
为第
u
个指标数据的聚类结果,
u
的取值范围为1至
N。3.
根据权利要求1所述的基于指标数据和日志数据的异常根因获得方法,其特征在于,步骤
S3
具体为:
S31
:将日志数据按照日志类别解析为日志键序列和参数向量序列;
S32
:基于
DeepLog
分析日志键序列,获得日志键异常分数序列
LAS
t

S33
:基于
DeepLog
分析参数向量序列,获得参数向量异常分数序列
LAS
p

S34
:通过日志键异常分数序列
LAS
t
和参数向量异常分数序列
LAS
p
,计算获得日志数据的日志异常分数序列
LAS。4.
根据权利要求3所述的基于指标数据和日志数据的异常根因获得方法,其特征在于,步骤
S32
具体为:
S321
:设置第一时间窗口,获取日志键序列在第一时间窗口内的日志键集合
window
h
={k
h

H
,k
h

H+1
,...,k
h
}
,其中,
h
为时刻,
H
为第一时间窗口的长度,
k
h
为第
h
个日志键;通过
Deeplog
预测日志键集合在
h+1
时刻的日志键
k
h+1

S322
:通过标准多项式逻辑函数计算获得日志键
k
h+1
的概率分布集合
P={k1:p1,k2:p2,...,k
i
:p
i
,...,k
g
:p
g
}
,其中,
i
为日志键的编号,
p
i
表示日志键
k
h+1
为日志键
k
i
的概率,
g
为日志键种类个数;
S323
:若
h+1
时刻的日志键的真实日志键为
k
i
,且
p
i
小于设置的阈值
Threshold
,则判断日志发生了执行路径异常,令
h+1
时刻的日志键异常分数...

【专利技术属性】
技术研发人员:张竞超张泽锟余螯
申请(专利权)人:安徽思高智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1