一种实时发现线下场所业务故障的方法和系统技术方案

技术编号:14882138 阅读:45 留言:0更新日期:2017-03-24 04:35
本发明专利技术公开了一种实时监控线下业务设备故障的方法和系统。线下场所业务节点设备上安装agent程序,监控线下场所的特定日志文件;Agent程序将文件更新数据上报至云端;云端的消息队列收集agent程序上报的数据;内存数据库将日志文件推送至ES集群,推送的日志文件会在ES集群被格式化;ES集群将格式化后的日志文件推送至云端的监控后台,运维人员可在监控后台对信息进行检索,从而对线下场所的节点设备动态进行实时监控。该系统包括监控端,云端服务器和监控后台端。本发明专利技术能够方便的对线下场所的设备进行实时监控和故障定位,避免因故障导致的经济损失。

【技术实现步骤摘要】

本专利技术涉及实时监控
,具体涉及KTV及酒吧等娱乐影音行业中业务故障的实时监控方法和系统。
技术介绍
KTV,影院和酒吧这些线下场所往往会有很多的服务器节点,拿KTV场所举例子:会存在视频服务器,中转服务器,数据库服务器以及各个包房的机顶盒。要在这么多的服务器节点中定位故障就成了一个特别繁琐的事情。现有技术对于该问题主要有两种解决方案,一是为每个场所配备运维人员,专职管理该场所的服务器,出故障时运维人员通过逐个排查各个服务器节点的操作日志;这个方案仅适合场所不大节点不多的环境,但作为KTV、酒吧这种娱乐影音场所,节点较多,定位故障节点困难,运维人员逐步排查故障耗时耗力,会给正在营业的场所带来较大损失。另一种方案是把所有的服务器都放到云端,由云端专业的运维人员对服务器节点统一进行管理;这个方案在实际实施的时候会有一定的局限性,并不是所有服务器都适合放在云端,例如KTV的中转服务器和数据库服务器等关键服务器,由于KTV场所个性化需求多样,并不适合将服务器放在云端托管。
技术实现思路
本专利技术解决的技术问题在解决于提供一种实时发现KTV、酒吧等娱乐影音行业内业务设备故障的实时监控系统和方法,实现了一种既不需要将线下场所的服务器放到云端又能实时对线下场所的故障进行实时监控,减少因故障排查等时间带来的损失,并且减少了KTV、酒吧等行业的系统运维人员的工作时间。基于本专利技术目的而提供的实时发现线下场所业务故障的方法,包括以下步骤:线下场所业务节点设备上安装agent程序,监控线下场所的特定日志文件;Agent程序将文件更新数据上报至云端;云端的消息队列收集agent程序上报的数据;内存数据库将日志文件推送至ES集群,推送的日志文件会在ES集群被格式化;ES将格式化后的日志文件推送至云端的监控后台,运维人员可在监控后台对信息进行检索,从而对线下场所的节点设备动态进行实时监控。所述业务节点设备包括视频服务器、数据库服务器、中转服务器、机顶盒设备、吧台机和ERP设备;所述特定日志文件是指线下场所包括服务器的所有业务节点设备的指定日志文件;所述文件更新数据包括视频服务器、数据库服务器、中转服务器和机顶盒、吧台机和ERP设备等线下影音娱乐场所的指定日志文件;所述指定日志文件是通过修改agent程序上的配置文件来选择监控日志文件的类别;所述配置文件的格式可由客户自行选择约定,约定后的配置文件会个性化定制线下场所需要关注的设备日志;所述日志文件信息主要包括控制中心地址,用户账户信息,操作员操作日志,数据库数据,与外部服务交互日志等服务器运行数据和操作系统自身产生的日志文件。云端包括消息队列,ES集群和监控后台;所述消息队列组件为redis内存数据库所提供;所述消息队列还可以为mysql、rabbitMq等数据库提供;所述redis内存数据库可以快速响应agent的数据上报;所述redis内存数据库由于以内存为存储介质,并发吞吐量高,操作单一,仅仅是存和取两个操作,不涉及复杂的运算处理,可防止上报并发量过大时阻塞日志上报。所述ES集群是ElasticSearch数据库集群;所述ES集群提供将收集的线下设备日志进行集中化管理;所述ES集群是一个Jave开发的搜索服务器,用于对日志的集中化管理和方便运维人员的检索;所述ElasticSearch是一个基于Lucene的搜索服务器,它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口,Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎;所述ES集群由于其将推送至云端的服务器或其他设备的日志进行格式化处理,服务器格式化处理的结果将日志文件进行转化,转化的结果包括两类,线下场所通用信息和业务相关信息。所述线下场所通用信息包括时间戳、场所标示ID、设备标示和服务标示。所述格式化后的服务器日志文件由于包括场所和设备标示信息,更便于运维人员的检索和故障快速定位;所述格式化后的日志文件推送至监控后台端;所述推送至监控后台的信息还可根据需要进行参数指标的表格化汇总成为参数报表,该报表数据数据会进行动态刷新。在其中一个实施例,所述云端服务器接收到Agent推送的日志数据并由ES集群格式化后,监控后台端可以对数据进行检索,方便实时监控线下场所的日志数据;所述的日志数据不仅可以监控线下设备的故障信息,也可以收集线下场所的非故障类日志信息。在其中一个实施例中,所述ES集群收集的日志数据信息包括线下场所的非故障类日志信息为线下场所的业务数据信息;所述业务数据信息包括日常流水和包房预订等信息日志,该部分信息可以实时记录线下场所的营业信息和顾客分类信息;所述非故障类信息可以作为线下场所的业务数据分析类来源。所述监控后台的参数报表可加入短信和邮件告警通知功能,真正达到动态实时监控线下设备故障的目的。在其中一个实施例中,所述后台端接受所述故障信息步骤之前,还包括以下步骤:所述监控后台端增加告警模块,在告警模块中设置并开启故障提醒功能;所述监控后台端接受到所述故障信息之后,还包括以下步骤:进行故障提醒。在其中一个实施例中,所述判断是否为故障信息,包括以下步骤:监测到的设备运行数据,判断是否超出设定阈值,若是则为故障信息,若否则非故障信息。在其中一个实施例中,所述的线下场所的机顶盒设备故障判断步骤,包括如下步骤:监测到的机顶盒设备从视频服务器拉取资源数据的时间日志在agent的配置文件中进行选定;机顶盒的agent程序将拉取时间作为一条日志进行上报;在ES集群中对上报日志进行格式化处理,格式化的数据形成数据报表格式;运维人员在云端对拉取时间的设定故障阈值,5分钟内出现3次从某一视频服务器拉取的时间超过5秒,即认定为故障信息。为实现本专利技术的目的还提供了一种线下场所的实时故障监控系统,包括监控端,云端服务器和监控后台端。所述监控端,用于实时监控线下设备日志信息,并上报至云端服务器;所述监控端由agent程序和通讯模块组成。所述云端服务器由消息队列模块和ES集群模块组成;所述消息队列用于收集线下数据并推送至ES集群,ES集群对线下数据进行格式化处理并集中管理数据,便于检索。所述监控后台端用于接收数据和分析数据,并做出故障报警;所述监控后台端包括数据接收模块、数据分析模块;所述数据接收模块用于接收ES集群格式化后的日志信息;所述数据分析模块用于将接收数据并形成数据报表格式,方便运维人员分析故障;所述数据分析模块可以设立故障阈值用于自动故障告警。在一个实施例中,所述的故障报警可以设定发送短信或邮件进行故障报警;在监控后台端增加告警模块,进行告警设置;所述监控后台端可以是手机、平板或电脑。所述云端监测可同时并联多个线下场所,减少运维成本;所述同时并联的多个线下场所,在云端由其场所标示ID的唯一编码进行分类处理。本专利技术的有益效果:本专利技术线下场所的设备故障云端报警方法和系统,能够方便的通过将服务器及其他业务设备日志推送至云端的方式,对线下设备进行监测,对线下设备的故障快速定位,避免因线下设备故障而导致的经济损失,同时云端可以同时监测多个线下场所,减少了运维成本。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/62/201611090448.html" title="一种实时发现线下场所业务故障的方法和系统原文来自X技术">实时发现线下场所业务故障的方法和系统</a>

【技术保护点】
一种实时发现线下场所业务故障的方法,其特征在于,包括以下步骤:线下场所业务节点设备上安装agent程序,监控线下场所的特定日志文件;Agent程序将文件更新数据上报至云端;云端的消息队列收集agent程序上报的数据;内存数据库将日志文件推送至ES集群,推送的日志文件会在ES集群被格式化;ES集群将格式化后的日志文件推送至云端的监控后台,运维人员可在监控后台对信息进行检索,从而对线下场所的节点设备动态进行实时监控。

【技术特征摘要】
1.一种实时发现线下场所业务故障的方法,其特征在于,包括以下步骤:线下场所业务节点设备上安装agent程序,监控线下场所的特定日志文件;Agent程序将文件更新数据上报至云端;云端的消息队列收集agent程序上报的数据;内存数据库将日志文件推送至ES集群,推送的日志文件会在ES集群被格式化;ES集群将格式化后的日志文件推送至云端的监控后台,运维人员可在监控后台对信息进行检索,从而对线下场所的节点设备动态进行实时监控。2.根据权利要求1所述的一种实时发现线下场所业务故障的方法,其特征在于,所述云端接收日志信息,设定故障阈值,并判断是否为故障信息。3.根据权利要求1所述的一种实时发现线下场所业务故障的方法,其特征在于,所述云端服务器保存的线下场所设备的日志信息,包括设备运转情况日志和线下场所营业数据类日志。4.根据权利要求3所述的一种实时发现线下场所业务故障的方法,其特征在于,所述云端服务器的存储的线下场所设备的日志信息推送至云端的监控后台端进行数据分析,分析结果包括线下场所设备故障信息和线下场所的非故障类信息,用户可对分析结果进行故障排除和营业情况分析。5.根据权利要求1所述的一种实时发现线下场所业务故障的方法,其特征在于,所述云端的监控后台端接收到ES模块推送后的格式化数据后,还包括以下步骤:所述监控后台端增加告警模块,在告警模块中设置并开启故障提醒功能;所述监控后台端对格式化数据进行分析,判断是否为故障类信息,若是,则发送故障信息至告警模块;所述告警模块接收到所述故障信息之后,进行故障提醒。6.根据权利要求5所述的一种实时发现线下场所业务故障的方法,其特...

【专利技术属性】
技术研发人员:沈建荣马哲谭国斌
申请(专利权)人:北京雷石天地电子技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1