【技术实现步骤摘要】
一种基于机器学习的运维机器人网络故障检测系统
本专利技术涉及智能运维
,具体是涉及一种基于机器学习的运维机器人网络故障检测系统。
技术介绍
运维工程师(Operations),负责维护并确保整个服务的高可用性,同时不断优化系统架构、提升部署效率、优化资源利用率提高整体的ROI。运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同得作用,因此运维工程师的工作内容和方向非常多:事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有:问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面运主要工作内容有:配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。发布管理:通过构建自动化的平台确保每一次版本变更可以 ...
【技术保护点】
1.一种基于机器学习的运维机器人网络故障检测系统,包括网络设备,其特征在于,还包括运维机器人以及收发器,每一收发器对应一网络设备设置;所述运维机器人,用于发送广播检测数据;当网络设备通过收发器接收到所述广播检测数据时,所述网络设备根据所述广播检测数据生成广播传递数据发送至所有与该网络设备连接的其他网络设备;以及当网络设备接收所述广播传递数据时,根据所述网络设备对应的网络协议处理所述广播传递数据得到协议反馈数据,将所述广播传递数据以及所述协议反馈数据通过对应的收发器发送至所述运维机器人,并将所述广播传递数据发送至与该网络设备直接连接的其他网络设备;所述运维机器人,根据接收到的广播传递数据以及协议反馈数据确定偏差数据;并根据偏差数据确定网络故障。
【技术特征摘要】
1.一种基于机器学习的运维机器人网络故障检测系统,包括网络设备,其特征在于,还包括运维机器人以及收发器,每一收发器对应一网络设备设置;所述运维机器人,用于发送广播检测数据;当网络设备通过收发器接收到所述广播检测数据时,所述网络设备根据所述广播检测数据生成广播传递数据发送至所有与该网络设备连接的其他网络设备;以及当网络设备接收所述广播传递数据时,根据所述网络设备对应的网络协议处理所述广播传递数据得到协议反馈数据,将所述广播传递数据以及所述协议反馈数据通过对应的收发器发送至所述运维机器人,并将所述广播传递数据发送至与该网络设备直接连接的其他网络设备;所述运维机器人,根据接收到的广播传递数据以及协议反馈数据确定偏差数据;并根据偏差数据确定网络故障。2.如权利要求1所述的一种基于机器学习的运维机器人网络故障检测系统,其特征在于:预先配置标准数据表;并在所述运维机器人侧配置故障诊断策略,该故障诊断策略包括随机生成的若干检测位置,每一检测位置对应有一标准数据表,每一所述检测位置对应所述运维机器人网络故障检测系统中的一个网络设备;所述运维机器人,根据接收到的广播传递数据以及协议反馈数据确定偏差数据,包括;所述运维机器人根据接收到的广播传递数据以及协议反馈数据建立反馈数据表,所述运维机器人根据检测位置调用标准数据表,所述运维机器人比较所述反馈数据表以及所述标准数据表,若所述反馈数据表和所述标准数据表不存在偏差,那么判断为无故障;若所述反馈数据表以及所述标准数据表存在偏差,则根据所述偏差得到偏差数据。3.如权利要求2所述的一种基于机器学习的运维机器人网络故障检测系统,其特征在于:所述运维机器人根据偏差数据确定网络故障包括:预先还配置有偏差数据以及偏差数据配对的处理策略;并配置故障学习策略;所述运维机器人根据偏差数据匹配处理策略,若运维数据库中存在所述偏差数据配对的处理策略,那么执行所述处理策略;若运维数据库中不存在所述偏差数据配对的处理策略,则执行所述故障学习策略,根据所述偏差数据生成一新的处理策略,并将新的所述处理策略与所述偏差数据配对并保存。4.如权利要求1所述的一种基于机器学习的运维机器人网络故障检测系统,其特征在于:所述广播传递数据包括传递路径信息,所述传递路径信息反映该广播传递数据所经过的网络设备以及经过网络设备的顺序。5.如权利要求4所述的一种基于机器学习的运维机器人网络故障检测系统,其特征在于:所述广播传递数据配置有预设的传递值,每一广播传递数据经过一网络设备值,该广播传递数据的对应的传递值减小,当广播传递数据的传递值小于零时,对应的网络设备不再将该广播传递数据发送至其他网络设备中。6.如权利要求5所述的一种基于机器学...
【专利技术属性】
技术研发人员:来骥,张少军,马跃,彭柏,许大卫,张实君,陈重韬,吴佳,吴舜,万莹,李贤,孟德,王海峰,李硕,王艺霏,辛霆麟,
申请(专利权)人:国网冀北电力有限公司信息通信分公司,国家电网公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。