超融合系统的网络状态监控方法、装置、设备及存储介质制造方法及图纸

技术编号:32459489 阅读:25 留言:0更新日期:2022-02-26 08:45
本发明专利技术公开了一种超融合系统的网络状态监控方法、装置、设备及存储介质,针对现有的超融合集群网络状态监控方法依赖于监控系统和集群整体通信网络的正常运行,导致网络状态监测组件与监控系统耦合度较高,当集群通信网络异常时,监控系统将无法感知到网络异常,造成网络异常信息丢失的问题,通过一个独立的、与告警系统解耦的服务(后台守护进程)非侵入地定时对集群网络状态进行采集、处理、缓存并对外提供查询接口,即使若干个节点的网络状态出现异常,仍可以将网络异常数据记录在本地,并且可通过其他节点与此节点的网络链接异常触发相应告警,使得网络异常情况及时被开发与维护人员注意到。护人员注意到。护人员注意到。

【技术实现步骤摘要】
超融合系统的网络状态监控方法、装置、设备及存储介质


[0001]本专利技术属于网络监控的
,尤其涉及一种超融合系统的网络状态监控方法、装置、设备及存储介质。

技术介绍

[0002]超融合集群往往由较多数量的节点组成,各个节点可能物理上处于不同的机柜,甚至不同地点的IDC(Internet Data Center),节点与节点、节点所在机柜之间、机柜所在IDC之间往往通过高速互联网链接,集群的正常运行依赖于整体网络的状态健康。节点间网络的连接状态通过采集到的各种数据来衡量,并且正确的数据采集、聚合方法对于准确地衡量连接状态具有至关重要的作用。
[0003]目前超融合集群网络状态监控措施有两种方法,一是利用已有监控工具例如prometheus,直接采集集群各节点的网络状态,这种方法依赖于监控系统的正常运行和集群整体网络状态正常。另一种方法为集群内所有节点周期互相通过ping来获取各节点的各个网口之间的网络状态,然后通过取平均值等计算方法取得最终需要呈现的网络状态。
[0004]上述超融合集群网络状态监控方法存在以下缺点:...

【技术保护点】

【技术特征摘要】
1.一种超融合系统的网络状态监控方法,其特征在于,包括:以独立的后台守护进程定时采集超融合集群的网络状态数据,所述网络状态数据包括集群内各节点之间网口收发包数量、各节点之间的连通性和网络延迟;将网络状态数据按预设时间段,以网口粒度聚合网口间的丢包率,生成网口间的延迟分布位图;将网络状态数据中的异常队列、延迟分布位图及延迟队列缓存于后台守护进程的内存空间;配置查询异常数据、延迟分布位图、网口丢包率的对外接口。2.如权利要求1所述的超融合系统的网络状态监控方法,其特征在于,所述以独立的后台守护进程定时采集超融合集群的网络状态数据进一步包括:获取超融合集群的网络拓扑信息;基于所述网络拓扑信息,获取各网口的硬件状态信息;通过网络工具获取集群内各节点之间的网络状态数据。3.如权利要求1所述的超融合系统的网络状态监控方法,其特征在于,缓存于后台守护进程的内存空间的网络状态数据进一步包括:通过ping获取并进行聚合的网络状态数据,以及通过解析目录/proc并聚合得到的网络状态数据。4.如权利要求3所述的超融合系统的网络状态监控方法,其特征在于,所述通过ping获取并进行聚合的网络状态数据进一步包括:将ping所用的延迟超过预设时间或者丢包的数据点,记为异常点;将延迟数据按数值所处的区间记录在延迟分布位图内;将ping获取的数据记录在延迟队列中。5.如权利要求1所述的超融合系统的网络状态监控方法,其特征在于,预设时间段内的网口/网卡丢包率的计算公式为:Loss Rate=(RXDropped2

RXDropped1)+(RXOverrun2

RXOverrun1)+(TXDropped2

TXDropped1)+(TXOverrun2

TXOverrun1)(RX2

RX1)+(TX2

TX1)其中,RXDropped2

RXDropped1:预设时间段内...

【专利技术属性】
技术研发人员:杜英杰
申请(专利权)人:北京志凌海纳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1