一种运维机房的监控系统、方法和搜索引擎技术方案

技术编号:15541515 阅读:419 留言:0更新日期:2017-06-05 10:53
本发明专利技术公开了一种布置在运维机房监控系统中的搜索引擎,包括:输入/输出接口,适于接收搜索请求,并将操作命令发送给各节点;数据存储设备,适于存储节点状态信息和运维日志记录,每个节点状态信息包括节点标识和状态特征向量,每条运维日志记录包括节点标识、解决方案、第一状态特征向量和第二状态特征向量;搜索模块,适于查找节点的状态特征向量,并根据该状态特征向量生成关于解决方案的列表;检测模块,适于从解决方案列表中依次选取解决方案、执行该解决方案中定义的检测操作;验证模块,适于将检测结果与该解决方案对应的第二状态特征向量进行对比;若对比一致则认为验证通过,若不一致则由检测模块继续进行检测,直到验证通过为止。

Monitoring system, method and search engine of operation and maintenance machine room

The invention discloses a layout in the operation and maintenance of computer room monitoring system in the search engine, including: input / output interface for receiving a search request, and sends operation command to each node; a data storage device for storage node status information and operation log records, each node state information includes node identification and feature vector each operation log records, including node identification, solution, the first feature vector and second feature vector; search module, feature vector for search node, and according to the state characteristic vector is generated a list of solutions; detection module, suitable for solutions from the list followed by selecting the solution, perform the test operation the definition of the solution; the authentication module, suitable for the detection results and the corresponding solutions of the second state The feature vectors are compared; if the comparison is consistent, the verification passes; if not consistent, the detection module continues the detection until the verification is passed.

【技术实现步骤摘要】
一种运维机房的监控系统、方法和搜索引擎
本专利技术涉及运维机房监控
,尤其是一种运维机房的监控系统、方法和搜索引擎。
技术介绍
现代信息化机房的环境设备(如,供配电、空调、消防、温湿度、漏水设备等)为计算机系统提供可靠的运行环境,同时,运维机房中大型计算设备本身的运行状态也对运维机房的正常运行至关重要。因此,对运维机房的监控是机房维护的重要工作之一。如上所述,运维机房内存在许多需要监控的要素,例如,计算设备的运气状态、供配电状态、空调运行情况、消防、温度、湿度、漏水等,一旦运维机房内出现电源故障、环境温度过高、空调运行异常、火灾和漏水等故障而又得不到及时处理,势必会对计算设备运行乃至计算机网络系统构成威胁,甚至会造成严重后果及损失。传统运维机房的监控设备对工作人员的依赖性强、工作效率低,一旦发生故障,只能向监控中心发送报警信息,工作人员接收到报警信息后再开始排查故障、进行维修,严重影响故障排除时间和工作效率。因此,需要一种能够节约运维人力成本和时间成本的监控方案。
技术实现思路
为此,本专利技术提供了一种运维机房的监控系统、方法和搜索引擎,以力图解决或者至少缓解上面存在的至少一个问题。根据本专利技术的一个方面,提供了一种搜索引擎,布置在运维机房的监控系统中,运维机房中包含多个节点,其中搜索引擎包括:输入/输出接口,适于接收来自客户端的搜索请求,以及将操作命令发送给各节点以便节点执行相应操作;数据存储设备,适于存储一个或者多个节点状态信息和一条或者多条运维日志记录,其中,每个节点状态信息包括节点标识和表征该节点的节点状态的状态特征向量,每条运维日志记录包括节点标识、解决方案、在执行解决方案前节点的第一状态特征向量和在执行解决方案后节点的第二状态特征向量;搜索模块,适于提取所述搜索请求中的节点标识,从一个或者多个节点状态信息中查找与该节点标识相对应的状态特征向量,并从一条或者多条运维日志记录中查找第一状态特征向量与状态特征向量相似的运维日志记录、并根据所查找到的运维日志记录中的解决方案生成解决方案列表;检测模块,适于从解决方案列表中依次选取一个解决方案、执行该解决方案中定义的检测操作,并获取该节点或机房的当前状态信息作为检测结果;验证模块,适于将检测结果与该解决方案对应的第二状态特征向量进行对比,若对比一致则认为验证通过,若对比不一致则认为验证不通过;输入/输出接口还适于在验证通过时发送解决方案中定义的执行操作给相应节点,以便该节点执行所述解决方案的执行操作;以及检测模块还适于在验证不通过时从所述解决方案列表中依序选取下一个解决方案并进行检测,直到验证通过为止。可选地,在根据本专利技术的搜索引擎中,搜索模块包括:提取子单元,适于提取搜索请求中的节点标识;查找子单元,适于从一个或多个节点状态信息中查找与该节点标识相对应的状态特征向量;以及计算子单元,适于从一条或多条运维日志记录中计算与该状态特征向量相似的至少一个第一状态特征向量、并根据其在运维日志记录中的解决方案生成解决方案列表。可选地,在根据本专利技术的搜索引擎中,搜索引擎与用于采集机房内节点状态信息的采集器相连接,输入/输出接口还适于通过采集器获取各节点的状态,其中,节点的状态包括节点的CPU运行状态数据和内存运行状态数据。可选地,在根据本专利技术的搜索引擎中,搜索引擎与用于采集机房状态信息的采集器相连接,输入/输出接口还适于通过所述采集器获取机房的状态,其中,机房的状态包括机房温度、湿度、电源、网络连接状态。可选地,在根据本专利技术的搜索引擎中,数据存储设备还适于根据各节点的状态和机房的状态分别生成状态特征向量。可选地,在根据本专利技术的搜索引擎中,运维日志记录还包括节点所在机房的机房标识、解决方案、在执行解决方案前机房的第一状态特征向量和在执行解决方案后机房的第二状态特征向量。可选地,在根据本专利技术的搜索引擎中,数据存储设备还适于在验证通过时,将该解决方案、节点标识和节点的第一状态特征向量、第二状态特征向量作为一条运维日志记录。可选地,在根据本专利技术的搜索引擎中,计算子单元还适于采用邻近算法计算状态特征向量间的相似性。可选地,在根据本专利技术的搜索引擎中,计算子单元还适于按照相似度从高到低的顺序,对所计算出的一条或多条运维日志记录进行排序。可选地,在根据本专利技术的搜索引擎中,运维日志记录中还包括节点标识对应的搜索词。可选地,在根据本专利技术的搜索引擎中,提取子单元还适于提取搜索请求中的搜索词;计算子单元还适于从运维日志记录中计算与所提取的搜索词具有相关性的搜索词对应的解决方案,一并列入解决方案列表。可选地,在根据本专利技术的搜索引擎中,搜索模块还适于在搜索不到与搜索请求中节点标识和/或搜索词相关的解决方案时,搜索该节点对应机房的解决方案。根据本专利技术的又一方面,提供了一种运维机房的监控系统,包括:多个采集器,适于采集机房内各节点的状态和机房的状态,其中,节点的状态包括节点的CPU运行状态数据和内存运行状态数据,机房的状态包括机房温度、湿度、电源、网络连接状态;如上所述的搜索引擎;以及执行器,布置在机房内各节点上,适于在接收到来自搜索引擎的执行命令时,执行对应解决方案的执行操作。可选地,在根据本专利技术的监控系统中,还包括:客户端,适于接收用户输入,并发送搜索请求给搜索引擎。根据本专利技术的又一方面,提供了一种运维机房的监控方法,包括步骤:响应于搜索请求,提取搜索请求中的节点标识;从一个或多个节点状态信息中查找该节点标识对应的状态特征向量,其中每个节点状态信息包括节点标识和表征节点状态的状态特征向量;从一条或多条运维日志记录中查找与该状态特征向量相似的至少一个第一状态特征向量对应的运维日志记录,其中每条运维日志记录包括节点标识、解决方案、在执行解决方案前节点的第一状态特征向量和在执行解决方案后节点的第二状态特征向量;根据所查找到的运维日志记录中的解决方案生成解决方案列表;从解决方案列表中依次选取一个解决方案并执行该解决方案中定义的检测操作,并获取该节点或机房的当前状态信息作为检测结果;将检测结果与该解决方案相关联的第二状态特征向量进行对比,若对比一致则认为验证通过,发送解决方案中定义的执行操作给相应节点,以便该节点执行解决方案的执行操作;以及若对比不一致则认为验证不通过,从解决方案列表中依序选取下一个解决方案,重复上述检测、对比验证步骤,直到验证通过为止。可选地,在根据本专利技术的监控方法中,在从一个或多个节点状态信息中查找该节点标识对应的状态特征向量的步骤之前,还包括步骤:获取机房内各节点的状态,并生成对应节点的状态特征向量;其中,节点的状态包括节点的CPU运行状态数据和内存运行状态数据。可选地,在根据本专利技术的监控方法中,获取机房内各节点状态的步骤还包括:获取机房的状态,并生成机房的状态特征向量;其中,机房的状态包括机房温度、湿度、电源、网络连接状态。可选地,在根据本专利技术的监控方法中,节点状态信息还包括节点所在机房的机房标识和表征机房状态的状态特征向量;运维日志记录中还包括节点所在机房的机房标识、解决方案、在执行解决方案前机房的第一状态特征向量和在执行解决方案后机房的第二状态特征向量。可选地,在根据本专利技术的监控方法中,若对比一致则认为验证通过的步骤之后,还包括:将该解决方案、节点标识和节点的第一本文档来自技高网...
一种运维机房的监控系统、方法和搜索引擎

【技术保护点】
一种搜索引擎,布置在运维机房的监控系统中,所述运维机房中包含多个节点,其中,所述搜索引擎包括:输入/输出接口,适于接收来自客户端的搜索请求,以及将操作命令发送给各节点以便节点执行相应操作;数据存储设备,适于存储一个或者多个节点状态信息和一条或者多条运维日志记录,其中,每个节点状态信息包括节点标识和表征该节点的节点状态的状态特征向量,每条运维日志记录包括节点标识、解决方案、在执行解决方案前节点的第一状态特征向量和在执行解决方案后节点的第二状态特征向量;搜索模块,适于提取所述搜索请求中的节点标识,从所述一个或者多个节点状态信息中查找与该节点标识相对应的状态特征向量,并从所述一条或者多条运维日志记录中查找第一状态特征向量与所述状态特征向量相似的运维日志记录、并根据所查找到的运维日志记录中的解决方案生成解决方案列表;检测模块,适于从所述解决方案列表中依次选取一个解决方案、执行该解决方案中定义的检测操作,并获取该节点或机房的当前状态信息作为检测结果;验证模块,适于将检测结果与该解决方案对应的第二状态特征向量进行对比,若对比一致则认为验证通过,若对比不一致则认为验证不通过;所述输入/输出接口还适于在验证通过时发送解决方案中定义的执行操作给相应节点,以便该节点执行所述解决方案的执行操作;以及所述检测模块还适于在验证不通过时从所述解决方案列表中依序选取下一个解决方案并进行检测,直到验证通过为止。...

【技术特征摘要】
1.一种搜索引擎,布置在运维机房的监控系统中,所述运维机房中包含多个节点,其中,所述搜索引擎包括:输入/输出接口,适于接收来自客户端的搜索请求,以及将操作命令发送给各节点以便节点执行相应操作;数据存储设备,适于存储一个或者多个节点状态信息和一条或者多条运维日志记录,其中,每个节点状态信息包括节点标识和表征该节点的节点状态的状态特征向量,每条运维日志记录包括节点标识、解决方案、在执行解决方案前节点的第一状态特征向量和在执行解决方案后节点的第二状态特征向量;搜索模块,适于提取所述搜索请求中的节点标识,从所述一个或者多个节点状态信息中查找与该节点标识相对应的状态特征向量,并从所述一条或者多条运维日志记录中查找第一状态特征向量与所述状态特征向量相似的运维日志记录、并根据所查找到的运维日志记录中的解决方案生成解决方案列表;检测模块,适于从所述解决方案列表中依次选取一个解决方案、执行该解决方案中定义的检测操作,并获取该节点或机房的当前状态信息作为检测结果;验证模块,适于将检测结果与该解决方案对应的第二状态特征向量进行对比,若对比一致则认为验证通过,若对比不一致则认为验证不通过;所述输入/输出接口还适于在验证通过时发送解决方案中定义的执行操作给相应节点,以便该节点执行所述解决方案的执行操作;以及所述检测模块还适于在验证不通过时从所述解决方案列表中依序选取下一个解决方案并进行检测,直到验证通过为止。2.如权利要求1所述的搜索引擎,其中,所述搜索模块包括:提取子单元,适于提取所述搜索请求中的节点标识;查找子单元,适于从所述一个或多个节点状态信息中查找与该节点标识相对应的状态特征向量;以及计算子单元,适于从所述一条或多条运维日志记录中计算与该状态特征向量相似的至少一个第一状态特征向量、并根据其在运维日志记录中的解决方案生成解决方案列表。3.如权利要求1或2所述的搜索引擎,所述搜索引擎与用于采集机房内节点状态信息的采集器相连接,所述输入/输出接口还适于通过所述采集器获取各节点的状态,其中,所述节点的状态包括节点的CPU运行状态数据和内存运行状态数据。4.如权利要求3所述的搜索引擎,其中,所述搜索引擎与用于采集机房状态信息的采集器相连接,所述输入/输出接口还适于通过所述采集器获取机房的状态,其中,...

【专利技术属性】
技术研发人员:陈超陈健黄新平范瑾乔楠
申请(专利权)人:北京并行科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1