System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种算力基础设施管理与运维系统技术方案_技高网
当前位置: 首页 > 专利查询>之江实验室专利>正文

一种算力基础设施管理与运维系统技术方案

技术编号:40094270 阅读:6 留言:0更新日期:2024-01-23 16:41
本发明专利技术公开了一种算力基础设施管理与运维系统,应用于智能计算领域的硬件设施管理,包括:机柜动态管理模块,聚焦于物理机房、机柜的信息查询、布局、空间规划,为机房扩容和运维工作提供决策依据;机房平面图数据可视化模块,实时以图形化方式渲染出机房空间布局、机柜结构形态、设备生命周期状态,支持精确到机柜每个U位的精细化渲染,以全景式的视角搭建机房平面图数据可视化屏;智能化设备管理及工单流转模块,支持精确到U位的设备管理,空闲U位支持在线绑定设备资产、已绑定设备的U位支持在线查询绑定设备、设备下架操作,并支持同步发起工单流程。可以实现面向智能计算领域的大规模基础设施的在线运维,提高运维效率。

【技术实现步骤摘要】

本专利技术属于算力基础设施管理,具体涉及一种算力基础设施管理与运维系统


技术介绍

1、随着云计算、人工智能、大数据等新一代信息技术快速发展,传统产业与新兴技术加速融合,数字经济蓬勃发展。算力基础设施作为各个行业信息系统运行的算力载体,已成为经济社会运行不可或缺的关键基础设施。随着算力基础设施的数量激增,算力基础设施建设正在向绿色化、智能化的方向发展,积极引入智能化管理,提升能效,降低运维管理的复杂度。

2、当前,算力基础设施如承载计算任务的主要硬件设备的基础维护、资产管理多处于被动运维阶段,如:机房等物理环境数据及设备资产等信息通常采用线下数据罗列的形式,效率低下;资产管理多存在手动的信息记录,无流程化;没有进行预防性维护与管理,运维人员大多在设备出现问题或者紧急需求时才会采取行动,导致处理的响应时间延迟。这种滞后性的管理方式存在协作性差、信息不一致性并且效率低下等问题,并且通常需要更多的人力、物力和时间,可能会影响业务的正常运行。

3、公开号为cn108416534a的专利文献公开了一种公共设备运维管理系统,包括:多个维护终端;至少一个管理终端;以及运维中心装置,其中,模式检索设定部根据设备类型检索获得与该设备类型对应的类型维护模式并将该类型维护模式设定为设备维护模式,任务生成部根据启用时间以及维护周期生成需要在当前维护时间段内进行维护的公共设备的设备信息的维护任务,人员分配部根据维护任务的设备类型对维护人员信息存储部进行检索获取能够进行对应类型的公共设备维护操作的维护人员并将检索得到的人员设定为待维护分配人员。但是该公共设备运维管理系统不能够实现对算力基础设施管理。

4、公开号为cn114637640a的专利文献公开了一种运维管理系统,包括:具有不同种类的多个云服务器的云平台、由运维人员持有的运维终端以及管理服务器,其中,管理服务器具有监控模块存储部、模块获取部、监控模块输出部、设备状态判断部以及管理侧通信部,模块获取部根据被运维人员选定的服务器种类从监控模块存储部中获取到对应的状态监控模块,监控模块输出部将状态监控模块发送给云服务器,运行部运行状态监控模块并获取运行状态数据发送给管理服务器,设备状态判断部对运行状态数据进行分析并判断出云服务器是否处于正常工作状态,一旦设备状态判断部判断云服务器未处于正常工作状态,管理侧通信部就发送告警信息给运维终端让管理员对云服务器进行维护。但是该系统不能实现对算力基础设施管理。


技术实现思路

1、为解决上述技术问题,本专利技术的目的是提供一种算力基础设施管理与运维系统,摆脱相对传统的人工盘点管理方法,应对智能计算领域大规模算力基础设施的运维,实现资产信息在线收集、动态管控、机房可视化渲染及面向机柜、设备的智能化管理,实现大规模基础设施的在线运维,提高运维效率。

2、为达到以上目的,本专利技术采用的一种算力基础设施管理与运维系统,包括机柜动态管理模块、机房平面图数据可视化模块、智能化设备管理及工单流转模块;

3、所述机柜动态管理模块用于依据获取的机房物理环境信息和当前机房空间规模信息,进行机柜的动态管理操作以实现机房的空间布局和空间规划,同时收集资产信息并支持信息查询;

4、所述机房平面图数据可视化模块用于根据实时获得的当前机房、机柜、设备信息,以图形化方式渲染出机房空间布局、机柜结构形态、设备生命周期状态,支持精确到机柜每个u位的精细化渲染,以全景式的视角搭建机房平面图数据可视化屏;

5、所述智能化设备管理及工单流转模块用于根据机柜以及机柜上设备信息实现每一个u位的设备管理,支持空闲u位在线绑定设备、已绑定设备的u位在线查询绑定设备信息、设备下架操作,并支持同步发起工单流转。

6、优选地,所述机柜动态管理模块,在面向机柜的动态管理之前,还包括:

7、获取数据中心所有机房信息,根据机房id在线查询机房空间规模数据,采用因为字符和阿拉伯数字编码机房内机柜的行号和列号,包括:以英文字符依次编码行号、阿拉伯数字依次编码列号,或以阿拉伯数字依次编码行号、英文字符依次编码列号。

8、优选地,所述机柜动态管理模块中,机柜的动态管理操作包括:

9、新增操作,即通过表单输入机柜信息,机柜信息包括机柜名称、所在机房、所在行号、所在列号、最大u位数、额定功率信息,以x行x列标识机房内机柜的空间位置,新增处于选定机房,指定行、列号空间位置的机柜;

10、更新操作,即支持对已有机柜的机柜信息进行更新;

11、删除操作,即支持对已有机柜资产信息进行删除。

12、优选地,所述机房平面图数据可视化模块中,针对当前机房,查询当前机房的空间规模信息,机柜信息,以图形化方式渲染出机柜结构形态、机柜信息,以及机柜与环境基础设置的相对空间位置分布,以x行x列标识机房规模空间布局,搭建机房的可视化平面图;

13、还实时计算每行机柜的行总功率及行剩余功率并显示在可视化平面图上。

14、优选地,所述机房平面图数据可视化模块中,针对单个机柜,基于机柜名称、总u位数、所属分区、所在行列位置以及剩余功率,以二维表格渲染单个机柜,表头顶部标识当前机柜的行列位置-所属分区-剩余功率,鼠标悬浮显示机柜名称,表格包含u位、机柜上设备名称、设备额定功率;按照u位总数从最大到最小u位编号依次垂直方向排列,每个u位为表格的一行,并标识当前u位编号。

15、优选地,所述机房平面图数据可视化模块中,针对单个机柜上设备的渲染,实时查询当前机柜及其绑定的设备信息,基于机柜u位与设备物理位置之间的映射关系,通过解析设备的起始u位和结束u位编号,合并u位跨度内的单元格,不同设备以不同颜色区块显示,完成设备与u位间的绑定与渲染;同时显示设备基本信息,设备基本信息包括设备名称、额定功率,精准定位每个设备资产的物理位置,直观展现机柜u位的整体空间利用率;

16、针对每个机柜上设备状态的渲染,获取设备的额定功率及上电状态、下电状态,设备额定功率列显示当前设备的额定功率值;若设备为上电状态,其占用的u位起始编号区间的单元格背景全部以单一颜色填充,下电状态填充另一颜色。

17、优选地,所述智能化设备管理及工单流转模块中,实现每个u位的设备管理,包括:点击机柜的每个u位,实时判断当前u位是否被占用,若未占用,则u位空闲,支持绑定设备,若占用,则绑定了设备,点击在当前设备的起始u位与结束u位范围内的任何位置,弹窗显示设备基本信息,包括使用者、品牌、资产编码、序列号、管理ip、外带ip、设备上或下电状态,并且提供设备的一系列智能化管理操作。

18、优选地,所述智能化设备管理及工单流转模块中,空闲u位在线绑定设备,包括:点击某u位显示设备绑定弹窗,选定起始u位和结束u位,设置设备上或下电状态,支持通过关键信息搜索设备资产,并从中选定目标设备,其中,关键信息包括设备名称、设备id、品牌、型号、资产编码、额定功率、资产采购部门、序列号、出入库状本文档来自技高网...

【技术保护点】

1.一种算力基础设施管理与运维系统,其特征在于,包括机柜动态管理模块、机房平面图数据可视化模块、智能化设备管理及工单流转模块;

2.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机柜动态管理模块,在面向机柜的动态管理之前,还包括:

3.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机柜动态管理模块中,机柜的动态管理操作包括:

4.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对当前机房,查询当前机房的空间规模信息,机柜信息,以图形化方式渲染出机柜结构形态、机柜信息,以及机柜与环境基础设置的相对空间位置分布,以X行X列标识机房规模空间布局,搭建机房的可视化平面图;

5.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对单个机柜,基于机柜名称、总U位数、所属分区、所在行列位置以及剩余功率,以二维表格渲染单个机柜,表头顶部标识当前机柜的行列位置-所属分区-剩余功率,鼠标悬浮显示机柜名称,表格包含U位、机柜上设备名称、设备额定功率;按照U位总数从最大到最小U位编号依次垂直方向排列,每个U位为表格的一行,并标识当前U位编号。

6.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对单个机柜上设备的渲染,实时查询当前机柜及其绑定的设备信息,基于机柜U位与设备物理位置之间的映射关系,通过解析设备的起始U位和结束U位编号,合并U位跨度内的单元格,不同设备以不同颜色区块显示,完成设备与U位间的绑定与渲染;同时显示设备基本信息,设备基本信息包括设备名称、额定功率,精准定位每个设备资产的物理位置,直观展现机柜U位的整体空间利用率;

7.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述智能化设备管理及工单流转模块中,实现每个U位的设备管理,包括:点击机柜的每个U位,实时判断当前U位是否被占用,若未占用,则U位空闲,支持绑定设备,若占用,则绑定了设备,点击在当前设备的起始U位与结束U位范围内的任何位置,弹窗显示设备基本信息,包括使用者、品牌、资产编码、序列号、管理IP、外带IP、设备上或下电状态,并且提供设备的一系列智能化管理操作。

8.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述智能化设备管理及工单流转模块中,空闲U位在线绑定设备,包括:点击某U位显示设备绑定弹窗,选定起始U位和结束U位,设置设备上或下电状态,支持通过关键信息搜索设备资产,并从中选定目标设备,其中,关键信息包括设备名称、设备ID、品牌、型号、资产编码、额定功率、资产采购部门、序列号、出入库状态、CPU型号、CPU数量、内存、GPU型号、GPU数量、存储类型、硬盘数量、网卡、业务IP、管理IP、带外IP、存储IP、合同号、经费编号、经费名称、备注;

9.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述智能化设备管理及工单流转模块中,已绑定设备的U位在线查询绑定设备信息,包括:点击已绑定U位的设备查询设备基本信息,还支持控制设备的上或下电状态,提交状态变更,保存后,设备状态实时变更,机房平面图动态更新。

10.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述智能化设备管理及工单流转模块中,设备下架操作,包括:点击已绑定U位的设备,支持下架设备操作,具体支持配置发起设备下架流程,生成设备下架信息化工单流转,实时推送至数据中心相应的运维人员;提交后,机房平面图实时更新,绑定U位区间内设备状态变更为下架中;运维人员审批通过后,下架信息化工单流转并执行设备下架操作,机房平面图实时更新,U位区间空闲。

...

【技术特征摘要】

1.一种算力基础设施管理与运维系统,其特征在于,包括机柜动态管理模块、机房平面图数据可视化模块、智能化设备管理及工单流转模块;

2.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机柜动态管理模块,在面向机柜的动态管理之前,还包括:

3.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机柜动态管理模块中,机柜的动态管理操作包括:

4.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对当前机房,查询当前机房的空间规模信息,机柜信息,以图形化方式渲染出机柜结构形态、机柜信息,以及机柜与环境基础设置的相对空间位置分布,以x行x列标识机房规模空间布局,搭建机房的可视化平面图;

5.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对单个机柜,基于机柜名称、总u位数、所属分区、所在行列位置以及剩余功率,以二维表格渲染单个机柜,表头顶部标识当前机柜的行列位置-所属分区-剩余功率,鼠标悬浮显示机柜名称,表格包含u位、机柜上设备名称、设备额定功率;按照u位总数从最大到最小u位编号依次垂直方向排列,每个u位为表格的一行,并标识当前u位编号。

6.根据权利要求1所述的算力基础设施管理与运维系统,其特征在于,所述机房平面图数据可视化模块中,针对单个机柜上设备的渲染,实时查询当前机柜及其绑定的设备信息,基于机柜u位与设备物理位置之间的映射关系,通过解析设备的起始u位和结束u位编号,合并u位跨度内的单元格,不同设备以不同颜色区块显示,完成设备与u位间的绑定与渲染;同时显示设备基本信息,设备基本信息包括设备名称、额定功率,精准定位每个设备资产的物理位置,直观展现机柜u位的整体空间利用率;

7.根据权利要求1所述的算力基础设施管...

【专利技术属性】
技术研发人员:葛慧玲李荣
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1