数据中心的连接故障确定方法、装置、电子设备和介质制造方法及图纸

技术编号:21308537 阅读:29 留言:0更新日期:2019-06-12 10:48
本发明专利技术实施例公开了一种数据中心的连接故障确定方法、装置、电子设备和介质,其中,该方法包括:基于物理图中节点连接度数确定服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;在交换机图中基于各个节点设备对应的哈希值,以及与服务器节点的连接关系,分别得到边缘交换机节点层、核心交换机节点层和聚合交换机节点层,并对各节点层中的节点设备进行参数标记;对服务器节点进行参数标记;按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图;利用物理图和中间矩阵图中的目标差异矩阵元素,确定故障节点设备及其节点角色。本发明专利技术实施例提高了确定数据中心节点连接故障的效率以及准确性。

Connection failure determination methods, devices, electronic devices and media for data centers

The embodiment of the present invention discloses a method, device, electronic equipment and medium for determining connection failure of a data center, in which the method includes: determining a server node based on the degree of connection of nodes in a physical graph, and determining a switch diagram based on node devices other than server nodes; and determining a switch diagram based on Hash values corresponding to each node device, as well as with a server in a switch diagram. The connection relationship of nodes is obtained, which includes edge switch node layer, core switch node layer and aggregate switch node layer. The node devices in each node layer are marked with parameters; the server nodes are marked with parameters; according to the connection relationship between the roles of each node in the blueprint, the intermediate matrix is created based on the node devices after parameter marking. Object difference matrix elements in physical and intermediate matrix graphs are used to determine fault node devices and their roles. The embodiment of the present invention improves the efficiency and accuracy of determining the connection failure of data center nodes.

【技术实现步骤摘要】
数据中心的连接故障确定方法、装置、电子设备和介质
本专利技术实施例涉及计算机网络
,尤其涉及一种数据中心的连接故障确定方法、装置、电子设备和介质。
技术介绍
为了给用户提供高带宽低延迟、稳定并可靠的网络服务,很多新开发的应用程序均部署在云环境中,这推动了存储、传输和计算服务从电脑客户端向数据中心(Datacenter,简称DC)的转变。为了满足单个电脑客户端中越来越多的服务需求,例如网络搜索、视频观看、移动互联网和云存储等,服务终端的规模呈指数级增长。构建合理的数据中心网络拓扑及路由,以实现数据中心快速扩展并充分利用数据中心网络性能,成为计算机网络领域的重要研究方向。现有技术中根据预先设计的数据矩阵形式的机房蓝图,基于图论理论,以及记录的设备与位置的对应关系,构建数据中心。但是,该构建过程比较繁琐,并且记录每一个设备与位置的对应关系是一项巨大的工作,而且这种记录可能容易出错,导致数据中心构建出错。现有的故障定位方法通常采用基于数据中心构建时采用的设计蓝图和从建好的数据中心收集的物理图,确定出设计蓝图和物理图之间的最大公共子图,则数据中心的故障部分即对应设计蓝图和物理图之间的差异部分。同时,假设管理员可以自己发现并修复有节点度数变化的故障,而对于节点度数不变的故障,首先在设计蓝图和物理图中初步确定预设数量的可能对应的节点,然后利用这些节点作为锚点来逐步扩展子图,并判断从设计蓝图和物理图中的锚点扩展出的子图是否同构,当判断出扩展的两个子图不同构时,则确定故障节点存在于当前子图中。上述故障定位方法的准确性取决于选择的用于检测的锚点数量与网络中的错误布线的数量。并且,在没有正确选择锚点的情况下,不仅非常耗时,而且准确率更低。考虑给出的结果不一定都是真正的故障节点,维护人员便需要首先检查故障定位结果报告中关于可能故障节点的长列表,然后手动确定真正的故障节点。
技术实现思路
本专利技术实施例提供一种数据中心的连接故障确定方法、装置、电子设备和介质,提高了确定数据中心的节点连接故障的效率以及准确性。第一方面,本专利技术实施例提供了一种数据中心的连接故障确定方法,该方法包括:将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。第二方面,本专利技术实施例还提供了一种数据中心的连接故障确定装置,该装置包括:服务器节点确定模块,用于将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;哈希值确定模块,用于在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;节点分类模块,用于根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;边缘与核心交换机节点层确定模块,用于在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;边缘与核心交换机节点层标记模块,用于按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;聚合交换机节点层确定及标记模块,用于将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;服务器节点标记模块,用于根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;中间矩阵图创建模块,用于按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;故障确定模块,用于确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。第三方面,本专利技术实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任一实施例所述的数据中心的连接故障确定方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任一实施例所述的数据中心的连接故障确定方法。本专利技术实施例首先基于物理图中节点连接度数确定服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;然后在交换机图中基于各个节点设备对应的哈希值,以及与服务器节点的连接关系,分别得到边缘交换机节点层、核心交换机节点层和聚合交换机节点层,并对当前确定的各节点层中的节点设备以及服务器节点进行参数标记;其次按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图;最后利用物理图和中间矩阵图中的目本文档来自技高网
...

【技术保护点】
1.一种数据中心的连接故障确定方法,其特征在于,包括:将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。...

【技术特征摘要】
1.一种数据中心的连接故障确定方法,其特征在于,包括:将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。2.根据权利要求1所述的方法,其特征在于,在所述交换机图中,基于每个节点设备与其他节点设备的连接关系,得到每个节点设备对应的哈希值,包括:在所述交换机图中,基于每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的矩阵子图;保持每个节点设备对应的矩阵子图中目标矩阵元素的位置顺序,得到对应于每个节点设备的由所述目标矩阵元素组成的数组,其中,所述目标矩阵元素是所述矩阵子图中除去节点设备占用的矩阵元素之外的剩余矩阵元素;将所述数组作为哈希函数的输入,得到每个节点设备对应的哈希值,其中,具有相同连接关系的节点设备对应相同的哈希值。3.根据权利要求1所述的方法,其特征在于,将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记,包括:在所述至少一个孤立节点设备中,将在所述物理图中同时与所述边缘交换机节点层和所述核心交换机节点层中的节点设备连接的节点设备划分为聚合交换机节点层;依据所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,使用所述边缘交换机节点层和所述核心交换机节点层中节点设备的标记参数对所述聚合交换机节点层中节点设备进行参数标记;将所述至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,其中,所述目标候选节点设备包括所述边缘交换机节点层或所述核心交换机节点层中的任一节点设备;使用每个剩余节点设备被划分的节点集合的标记参数,对每个剩余的节点设备进行参数标记。4.根据权利要求3所述的方法,其特征在于,在确定所述边缘交换机节点层和所述核心交换机节点层中分别包括的节点集合后,所述方法还包括:将所述边缘交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整边缘集合;将所述核心交换机节点层中包含的节点设备数量小于所述节点数量阈值的节点集合标记为不完整核心集合;其中,所述节点数量阈值与用于构建所述设计蓝图的网络拓扑图相关;相应的,所述目标候选节点设备包括所述不完整边缘集合或所述不完整核心集合中的任一节点设备。5.根据权利要求3或4所述的方法,其特征在于,将所述至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,包括:确定所述剩余节点设备中每个剩余节点设备的连接度数;根据所述每个剩余节点设备的连接度数与第二度数阈值的关系,确定每个剩余节点设备所属的目标节点层,其中,所述目标节点层包括所述边缘交换机节点层或所述核心交换机节点层,所述第二度数阈值与用于构建所述设计蓝图的网络拓扑图相关;在所述目标节点层中确定所述目标候选节点设备,按照每个剩余节点设备和所述目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中。6.根据权利要求5所述的方法,其特征在于,所述按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,包括:按照每个剩余节点设备与其他节点设备的连接关系,确定每个剩余节点设备的剩余节点矩阵子图;按照目标候选节点设备与其他节点设备的连接关系,确定所述目标候选节点设备的目标节点矩阵子图;将所述剩余节点矩阵子图和所述目标节点矩阵子图中相同位置上的矩阵元素进行异或计算,确定两个矩阵子图中差异矩阵元素的数量;根据所述差异矩阵元素的数量确定每个剩余节点设备和所述目标候选节点设备分别...

【专利技术属性】
技术研发人员:张彻张实唯汪漪
申请(专利权)人:南方科技大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1