当前位置: 首页 > 专利查询>余绍祥专利>正文

一种基于机器学习的智能运维机器人系统技术方案

技术编号:17779017 阅读:30 留言:0更新日期:2018-04-22 07:10
本发明专利技术提供了一种基于机器学习的智能运维机器人系统,包括后台处理端、运维数据库以及若干运维机器人,所述故障学习策略包括当所述异常信号被输出到后台处理端时,根据所述后台处理端输入的处理结果生成一新的所述处理策略,并将新地所述处理策略存入所述运维数据库,并根据所述处理策略对应的故障参数通过一参数波动值生成一故障参数范围,根据所述处理策略对应的故障时间通过一时间波动值生成一故障时间范围,生成故障时间在所述故障时间范围内且故障参数在所述故障参数范围内的新的异常信号,关联所述新的异常信号和新的所述处理策略。

【技术实现步骤摘要】
一种基于机器学习的智能运维机器人系统
本专利技术涉及智能运维机器人
,具体是涉及一种基于机器学习的智能运维机器人系统。
技术介绍
运维工程师(Operations),负责维护并确保整个服务的高可用性,同时不断优化系统架构、提升部署效率、优化资源利用率提高整体的ROI.运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同得作用,因此运维工程师的工作内容和方向非常多:事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有:问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面运主要工作内容有:配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之。在这方面主要工作内容有:容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、优化服务部署架构等方法来高效的提升系统容量。架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。而市场上目前推出了一种运维机器人,可以代替运维工程师以解决系统运维的问题,但是这种运维机器人只能根据实际情况作出应对,不具有自主学习的能力,所以导致在配置运维机器人时所做的工作较为繁琐,造成了较大的设计成本,且无法适应实际的使用需求,根据实际使用的需求情况作出应对。
技术实现思路
针对现有技术中存在的上述问题,现旨在提供一种基于机器学习的智能运维机器人系统,以解决上述问题。具体技术方案如下:一种基于机器学习的智能运维机器人系统,包括后台处理端、运维数据库以及若干运维机器人,所述运维机器人于一预设的被检设备区中配置有预设路线,所述运维机器人配置有检测模块,所述检测模块用于采集所述被检区域的环境参数,所述运维机器人沿预设路线移动并将获取的所述环境参数上传至后台处理端,所述后台终端连接所述运维数据库,所述运维数据库用于存储运维信息;所述检测模块包括有热成像装置、摄像头、温度传感器以及湿度传感器,所述热成像装置用于采集所述被检区域的热成像信息,所述摄像头用于采集被检区域的图像信息,所述温度传感器用于采集被检区域的温度信息,所述湿度传感器用于采集被检区域的湿度信息,所述环境参数包括所述热成像信息、图像信息、温度信息以及湿度信息;所述后台处理端配置有机器学习模块,所述机器学习模块配置有故障检测策略以及故障学习策略;所述故障检测策略包括配置于所述运维数据库的触发参数,当所述环境参数与触发参数不匹配时,输出异常信号,所述异常信号包括信号故障时间以及故障参数,所述运维数据库对应异常信号关联有处理策略,当所述异常信号在所述运维数据库存在关联的处理策略时,执行所述处理策略,当所述异常信号的故障参数在所述运维数据库不存在关联的处理策略时,将所述异常信号输出到后台处理端;所述故障学习策略包括当所述异常信号被输出到后台处理端时,根据所述后台处理端输入的处理结果生成一新的所述处理策略,并将新的所述处理策略存入所述运维数据库,并根据所述处理策略对应的故障参数通过一参数波动值生成一故障参数范围,根据所述处理策略对应的故障时间通过一时间波动值生成一故障时间范围,生成故障时间在所述故障时间范围内且故障参数在所述故障参数范围内的新的异常信号,关联所述新的异常信号和新的所述处理策略。进一步地:所述故障检测策略包括热成像检测子策略,所述热成像检测子策略包括通过热成像算法捕获所述热成像信息中的热特征图区,并根据所述热特征图区的图形以及所述热特征图区所对应的热成像位姿生成热成像特征信息,所述触发参数包括热成像比对信息,每一所述热成像比对信息均存在一关联的热成像位姿,所述热成像特征信息根据所述热成像位姿调取对应的热成像比对信息,所述热成像比对信息包括热特征裕量以及基准热特征图区,当所述热特征图区和基准热特征图区的热特征差值绝对值大于所述热特征裕量时,判断对应的所述环境参数和所述触发参数不匹配;所述故障参数包括所述热成像特征信息以及所述热特征差值。进一步地:所述故障检测策略包括图像成像子策略,所述图像检测子策略包括通过图像捕捉算法捕获所述图像成像信息中的图像特征图区,并根据所述图像特征图区的图形以及所述图像特征图区对应的图像成像位姿生成图像特征信息,所述触发参数包括图像比对信息,每一所述图像比对信息均存在一关联的图像成像位姿,所述图像特征信息根据所述图像成像位姿调取对应的图像比对信息,所述图像比对信息包括图像特征裕量以及基准图像特征图区,当所述图像特征图区和基准图像特征图区的图像特征差值绝对值大于所述图像特征裕量时,判断对应的所述环境参数和触发参数不匹配;所述故障参数包括图像特征信息以及图像特征差值。进一步地:所述故障检测策略包括热像动态子策略,所述热像动态子策略包括分别通过热成像算法和图像捕捉算法捕获所述热成像信息中的热特征图区以及所述图像成像信息中的图像特征图区,所述热特征图区和图像特征图区具有相同的一热像位姿,根据所述热像位姿以及所述热像位姿对应的热特征图区和图像特征图区生成一热像特征信息,所述触发信息包括热像比对信息,每一所述热像比对信息均存在一关联的热像位置,所述热像特征信息根据所述热像位姿调取对应的热像比对信息,所述热像比对信息包括热像特征裕量、基准图像特征图区以及基准热特征图区,根据加权算法求取所述热特征图区和基准热特征图区的热特征差值绝对值和所述图像特征图区和基准图像特征图区的图像特征差值绝对值之和以获得一热像差值,若所述热像差值大于所述热像特征裕量,判断对应的所述环境参数和所述触发参数不匹配。进一步地:所述故障检测策略包括一温度检测子策略,所述温度检测子策略包括实时获取所述温度信息,所述温度信息包括温度值以及与该温度值对应的温度检测位置,所述触发信息包括温度比对信息,所述温度比对信息包括基准温度值以及温度裕量,每一所述温度比对信息包括有均存在一关联的温度检测位置,所述温度信息根据所述温度检测位置调取对应的温度比对信息,当所本文档来自技高网
...
一种基于机器学习的智能运维机器人系统

【技术保护点】
一种基于机器学习的智能运维机器人系统,其特征在于:包括后台处理端、运维数据库以及若干运维机器人,所述运维机器人于一预设的被检设备区中配置有预设路线,所述运维机器人配置有检测模块,所述检测模块用于采集所述被检区域的环境参数,所述运维机器人沿预设路线移动并将获取的所述环境参数上传至后台处理端,所述后台终端连接所述运维数据库,所述运维数据库用于存储运维信息;所述检测模块包括有热成像装置、摄像头、温度传感器以及湿度传感器,所述热成像装置用于采集所述被检区域的热成像信息,所述摄像头用于采集被检区域的图像信息,所述温度传感器用于采集被检区域的温度信息,所述湿度传感器用于采集被检区域的湿度信息,所述环境参数包括所述热成像信息、图像信息、温度信息以及湿度信息;所述后台处理端配置有机器学习模块,所述机器学习模块配置有故障检测策略以及故障学习策略;所述故障检测策略包括配置于所述运维数据库的触发参数,当所述环境参数与触发参数不匹配时,输出异常信号,所述异常信号包括信号故障时间以及故障参数,所述运维数据库对应异常信号关联有处理策略,当所述异常信号在所述运维数据库存在关联的处理策略时,执行所述处理策略,当所述异常信号的故障参数在所述运维数据库不存在关联的处理策略时,将所述异常信号输出到后台处理端;所述故障学习策略包括当所述异常信号被输出到后台处理端时,根据所述后台处理端输入的处理结果生成一新的所述处理策略,并将新地所述处理策略存入所述运维数据库,并根据所述处理策略对应的故障参数通过一参数波动值生成一故障参数范围,根据所述处理策略对应的故障时间通过一时间波动值生成一故障时间范围,生成故障时间在所述故障时间范围内且故障参数在所述故障参数范围内的新的异常信号,关联所述新的异常信号和新的所述处理策略。...

【技术特征摘要】
1.一种基于机器学习的智能运维机器人系统,其特征在于:包括后台处理端、运维数据库以及若干运维机器人,所述运维机器人于一预设的被检设备区中配置有预设路线,所述运维机器人配置有检测模块,所述检测模块用于采集所述被检区域的环境参数,所述运维机器人沿预设路线移动并将获取的所述环境参数上传至后台处理端,所述后台终端连接所述运维数据库,所述运维数据库用于存储运维信息;所述检测模块包括有热成像装置、摄像头、温度传感器以及湿度传感器,所述热成像装置用于采集所述被检区域的热成像信息,所述摄像头用于采集被检区域的图像信息,所述温度传感器用于采集被检区域的温度信息,所述湿度传感器用于采集被检区域的湿度信息,所述环境参数包括所述热成像信息、图像信息、温度信息以及湿度信息;所述后台处理端配置有机器学习模块,所述机器学习模块配置有故障检测策略以及故障学习策略;所述故障检测策略包括配置于所述运维数据库的触发参数,当所述环境参数与触发参数不匹配时,输出异常信号,所述异常信号包括信号故障时间以及故障参数,所述运维数据库对应异常信号关联有处理策略,当所述异常信号在所述运维数据库存在关联的处理策略时,执行所述处理策略,当所述异常信号的故障参数在所述运维数据库不存在关联的处理策略时,将所述异常信号输出到后台处理端;所述故障学习策略包括当所述异常信号被输出到后台处理端时,根据所述后台处理端输入的处理结果生成一新的所述处理策略,并将新地所述处理策略存入所述运维数据库,并根据所述处理策略对应的故障参数通过一参数波动值生成一故障参数范围,根据所述处理策略对应的故障时间通过一时间波动值生成一故障时间范围,生成故障时间在所述故障时间范围内且故障参数在所述故障参数范围内的新的异常信号,关联所述新的异常信号和新的所述处理策略。2.如权利要求1所述的一种基于机器学习的智能运维机器人系统,其特征在于:所述故障检测策略包括热成像检测子策略,所述热成像检测子策略包括通过热成像算法捕获所述热成像信息中的热特征图区,并根据所述热特征图区的图形以及所述热特征图区所对应的热成像位姿生成热成像特征信息,所述触发参数包括热成像比对信息,每一所述热成像比对信息均存在一关联的热成像位姿,所述热成像特征信息根据所述热成像位姿调取对应的热成像比对信息,所述热成像比对信息包括热特征裕量以及基准热特征图区,当所述热特征图区和基准热特征图区的热特征差值绝对值大于所述热特征裕量时,判断对应的所述环境参数和所述触发参数不匹配;所述故障参数包括所述热成像特征信息以及所述热特征差值。3.如权利要求1所述的一种基于机器学习的智能运维机器人系统,其特征在于:所述故障检测策略包括图像成像子策略,所述图像检测子策略包括通过图像捕捉算法捕获所述图像成像信息中的图像特征图区,并根据所述图像特征图区的图形以及所述图像特征图区对应的图像成像位姿生成图像特征信息,所述触发参数包括图像比对信息,每一所述图像比对信息均存在一关联的图像成像位姿,所述图像特征信息根据所述图像成像位姿调取对应的图像比对信息,所述图像比对信息包括图像特征裕量以及基准图像特征图区,当所述图像特征图区和基准图像特征图区的图像特征差值绝对值大于所述特征图像特征裕量时,判断对应的所述环境参数和触发参数不匹配;所述故障参数包括图像特征信息以及图像特征差值。4.如权利要求1所述的一种基于机器学习的智能运维机器人系统,其特征在于:所述故障检测策略包括热像动态子策略,所述热像动态子策略包括分别通过热成像算法和图像捕捉算法捕获所述热成像信息中的热特征图区以及所述图像成像信息中的图像特征图区,所述热特征图区和图像特征图区具有相同的一热像位姿,根据所述热像位姿以及所述热像位姿对应的热特征图区和图像特征图区生成一热像特征信息,所述触发信息包括热像比对信息,每一所述热像比对信息均存在...

【专利技术属性】
技术研发人员:余绍详
申请(专利权)人:余绍祥
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1