【技术实现步骤摘要】
告警日志推送方法、装置、计算机设备及存储介质
[0001]本专利技术涉及告警信息处理
,具体涉及告警日志推送方法
、
装置
、
计算机设备及存储介质
。
技术介绍
[0002]为了保证服务器等系统运维和故障排查的顺利进行,通常会将系统运行过程中记录的大量告警日志存储在数据库中,如果这些告警日志得不到及时处理,庞大的告警日志就会长期累积在数据库,占用大量的存储空间,对存储空间
、
电路和传输网络带宽带来难以想象的沉重负担,也会影响系统性能
。
[0003]目前,对告警日志的处理仍然依赖于运维工程师的人工分析判别
。
运维工程师在处理告警日志的过程中,通常定义相关规则从海量的告警日志中选取相同故障的告警,进行批量处理
。
然而,手动定义关联规则很难覆盖告警日志之间的所有关联,导致告警日志的处理效率较低
。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种告警日志推送方法
、 >装置
、<本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种告警日志推送方法,其特征在于,应用于存储设备,所述方法包括:获取
N
个告警日志,
N
为大于或者等于2的整数;确定所述
N
个告警日志中任意两个告警日志之间的融合相似度,所述融合相似度用于表征所述任意两个告警日志之间的相似程度;根据所述融合相似度对所述
N
个告警日志进行聚类处理,得到
K
个聚类簇,
K
为整数,且
1≤K
<
N
,所述聚类簇中所述任意两个告警日志之间的所述融合相似度大于预设阈值;确定所述
K
个聚类簇中每个聚类簇中至少一个代表性告警日志,所述代表性告警日志为所述聚类簇中与其他告警日志的平均融合相似度最大的告警日志;向客户端发送所述
K
个聚类簇中每个聚类簇中所述至少一个代表性告警日志
。2.
根据权利要求1所述的方法,其特征在于,在所述确定所述
N
个告警日志中任意两个告警日志之间的融合相似度之前,所述方法还包括:对所述
N
个告警日志进行预处理,得到所述
N
个告警日志中每个告警日志的有效词元集合,所述有效词元集合包括至少一个有效词元,所述预处理包括日志排序
、
日志去重
、
日志清洗
、
日志分词
、
去停用词
、
词元标准化中的至少一项;所述确定所述
N
个告警日志中任意两个告警日志之间的融合相似度,包括:根据所述有效词元集合确定所述
N
个告警日志中任意两个告警日志之间的所述融合相似度
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述有效词元集合确定所述
N
个告警日志中任意两个告警日志之间的所述融合相似度,包括:将第
i
个告警日志的所述有效词元集合中每个有效词元输入连续词袋模型,得到每个有效词元的词元向量,
i
=1,2,
……
,
N
;根据词频
‑
逆文档频率模型确定所述第
i
个告警日志的所述有效词元集合中每个有效词元的词频特征;根据所述有效词元集合中每个有效词元的所述词元向量和所述词频特征确定所述第
i
个告警日志的语义特征;根据第一告警日志的语义特征和第二告警日志的语义特征确定所述第一告警日志和所述第二告警日志的文本相似度,所述第一告警日志为所述任意两个告警日志中的其中一个告警日志,所述第二告警日志为所述任意两个告警日志中的另一个告警日志;根据用于描述所述存储设备的架构的软件拓扑图和硬件拓扑图确定所述第一告警日志和所述第二告警日志的拓扑相关度;根据所述文本相似度和所述拓扑相关度确定所述第一告警日志和所述第二告警日志的所述融合相似度
。4.
根据权利要求3所述的方法,其特征在于,所述根据所述文本相似度和所述拓扑相关度确定所述第一告警日志和所述第二告警日志的所述融合相似度,包括:根据权重系数
、
所述文本相似度和所述拓扑相关度,通过如下公式确定所述融合相似度:
similarity(a,b)
=
α
×
texual(a,b)+(1
‑
α
)
×
correlation(a,b)
其中,
a
表示所述第一告警日志,
b
表示所述第二告警日志,
similarity(a,b)
表示所述第一告警日志和所述第二告警日志的所述融合相似度,
α
表示所述权重系数,
texual(a,b)
表示所述第一告警日志和所述第二告警日志的所述文本相似度,
correlation(a,b)
表示所述第一告警日志和所述第二告警日志的所述拓扑相关度
。5.
根据权利要求3所述的方法,其特征在于,所述根据所述有效词元集合中每个有效词元的所述词元向量和所述词频特征确定所述第
i
个告警日志的语义特征,包括:根据所述有效词元集合中每个有效词元的所述词元向量和所述词频特征,通过如下公...
【专利技术属性】
技术研发人员:张小康,贾上坤,
申请(专利权)人:济南浪潮数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。