一种自动故障定位方法、系统及介质技术方案

技术编号:37716893 阅读:12 留言:0更新日期:2023-06-02 00:13
本发明专利技术公开了一种自动故障定位方法、系统及介质,涉及服务器维护技术领域。所述方法包括:在服务器节点上对涉及工作中心机制的异步操作定义日志输出格式;实时获取服务器产生的日志,做日志格式解析后发往ES集群;根据日志收集的定义在ES集群中对应创建出索引保存日志数据,然后提供接口供展示端调用展示日志数据。本发明专利技术提供的一种自动故障定位方法、系统及介质,能跟踪整个复杂的操作链结转过程,解决了服务日志混乱的问题,便于故障定位实现快速排查问题。速排查问题。速排查问题。

【技术实现步骤摘要】
一种自动故障定位方法、系统及介质


[0001]本专利技术涉及服务器维护
,特别涉及一种自动故障定位方法、系统及介质。

技术介绍

[0002]为了容灾高可用和日益增长的用户访问量,提高并发和吞吐量,现有的云桌面系统常规为分布式部署,通过haproxy做负载均衡分流,多个节点同时提供服务。系统拥有多种不同层级的服务,降低服务间耦合度,能够单独监控各服务压力状态,通过负载分配,将请求分发到不同的服务器上。
[0003]然而,上述的分布式和集群架构在正式生产环境中,会产生以下问题:
[0004]1、该架构日志分散到各个服务器中,分布式各个服务也多,每个服务都有自己的一系列服务日志,再加上有haproxy/nginx这样的负载均衡器的存在,因此无法准确知道一次请求是发往哪台服务器的哪个服务节点,这个问题导致运维人员收集日志、跟踪日志排查问题变得繁琐和低效。为解决这个问题现有的方案是将所有服务器上运行的所有服务日志都收集到一个统一的Log日志服务器上,排查问题时到日志服务器上统一去下载拷贝但是该方式无法实时明确跟踪日志,存在时效性的滞后,且日志打印必须限定保留一定份数和单份大小以防占用过多存储从而影响正常业务运行,因此日志文件无法保留太长时间。
[0005]2、由于系统服务层级多,比较复杂的业务操作涉及调用链长,在排查问题时只能从最上层一层层往下剥离排查,并且如果有耗时长的调用会立即返回然后异步执行,由工作中心机制(work)来完成,通过消息队列来做消息传递和流转,一旦中间出现异常,排查问题会很复杂繁琐,work异步执行的机制也可能出现跟踪排查在这条调用链的某个节点失去线索。

技术实现思路

[0006]本专利技术要解决的技术问题,在于提供一种自动故障定位方法、系统及介质,通过工作机制优化适配日志收集分析系统,能跟踪整个复杂的操作链结转过程,便于故障定位实现快速排查问题。
[0007]第一方面,本专利技术提供了一种自动故障定位方法,包括:
[0008]在服务器节点上对涉及工作中心机制的异步操作定义日志输出格式;
[0009]实时获取服务器产生的日志,做日志格式解析后发往ES集群;
[0010]根据日志收集的定义在ES集群中对应创建出索引保存日志数据,然后提供接口供展示端调用展示日志数据。
[0011]进一步地,所述日志输出格式包括当前操作类型、workId、节点信息、执行状态以及资源参数;所述日志格式解析的结果包括:请求源地址IP、请求响应服务器IP、请求时间、日志内容、日志级别、对应的代码具体类以及服务名称。
[0012]进一步地,所述实时获取服务器产生的日志,通过在需收集日志的服务器上安装日志收集组件,通过配置文件配置收集日志的目录、格式解析规则和发往的ES地址,所述日
志包括系统日志、应用日志、服务日志和/或自定义日志。
[0013]进一步地,所述方法还包括:获取用户在展示端输入的关键字然后在ES集群进行全文检索,根据检索结果可视化展示出整个操作链的结转过程、资源状态、工作状态;
[0014]在所述展示端创建用户、配置加密通信及身份验证功能,分配角色和所管辖的数据索引,通过用户认证实现数据隔离。
[0015]第二方面,本专利技术提供了一种自动故障定位系统,包括:日志输出模块、日志解析模块以及日志存储模块;
[0016]所述日志输出模块,用于在服务器节点上对涉及工作中心机制的异步操作定义日志输出格式;
[0017]所述日志解析模块,用于实时获取服务器产生的日志,做日志格式解析后发往ES集群;
[0018]所述日志存储模块,用于根据日志收集的定义在ES集群中对应创建出索引保存日志数据,然后提供接口供展示端调用展示日志数据。
[0019]进一步地,所述日志输出模块中,日志输出格式包括当前操作类型、workId、节点信息、执行状态以及资源参数;所述日志解析模块中,日志格式解析的结果包括:请求源地址IP、请求响应服务器IP、请求时间、日志内容、日志级别、对应的代码具体类以及服务名称。
[0020]进一步地,所述日志解析模块中,实时获取服务器产生的日志,通过在需收集日志的服务器上安装日志收集组件,通过配置文件配置收集日志的目录、格式解析规则和发往的ES地址,所述日志包括系统日志、应用日志、服务日志和/或自定义日志。
[0021]进一步地,所述系统还包括查询展示模块,用于获取用户在展示端输入的关键字然后在ES集群进行全文检索,根据检索结果可视化展示出整个操作链的结转过程、资源状态、工作状态;
[0022]在所述展示端创建用户、配置加密通信及身份验证功能,分配角色和所管辖的数据索引,通过用户认证实现数据隔离。
[0023]第三方面,本专利技术提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
[0024]本专利技术实施例的技术方案至少具有如下优点:
[0025]1、通过对日志进行统一收集和管理,减少频繁对原服务器的访问,提高服务器的访问安全性;通过对涉及工作中心机制的异步操作定义日志输出格式然后解析,便于整个操作链的问题排查;
[0026]2、结合work工作中心机制优化,通过日志系统根据查询条件全文检索,展示出复杂的异步操作整个操作链的结转过程、资源状态、工作状态等,出现问题从链的开始到结尾查看日志即可一目了然;
[0027]3、日志收集可采集系统日志、应用日志、服务日志、甚至是自定义日志,适配多种格式化、过滤规则也支持自定义规则,因此通用性较好,可使用领域方向广;
[0028]4、通过构架的可视化面板,统计数据一目了然,多维度全文检索查询,提高定位问题效率;
[0029]5、通过配置TLS加密通信及身份验证功能,在展示端需要用户认证,可以创建用
户,分配角色和所管辖的数据索引,以此来做数据隔离保障数据安全。
附图说明
[0030]下面参照附图结合实施例对本专利技术作进一步的说明。
[0031]图1为本专利技术系统的整体架构图;
[0032]图2为本专利技术实施例的组件交互示意图;
[0033]图3为本专利技术实施例一方法的执行流程图;
[0034]图4为本专利技术实施例一启动桌面work流转优化示意图;
[0035]图5为本专利技术实施例一启动桌面服务间流转优化示意图;
[0036]图6为本专利技术实施例一监控数据库信息示意图;
[0037]图7为本专利技术实施例二系统的功能模块示意图;
[0038]图8为本专利技术实施例三介质的结构示意图。
具体实施方式
[0039]本专利技术实施例提供一种自动故障定位方法、系统及介质,通过工作机制优化适配日志收集分析系统,能跟踪整个复杂的操作链结转过程,便于故障定位实现快速排查问题。
[0040]本专利技术实施例中的技术方案,总体思路如下:
[0041]1、日志统一收集、管理、访问:持续收集读取日志,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动故障定位方法,其特征在于,包括:在服务器节点上对涉及工作中心机制的异步操作定义日志输出格式;实时获取服务器产生的日志,做日志格式解析后发往ES集群;根据日志收集的定义在ES集群中对应创建出索引保存日志数据,然后提供接口供展示端调用展示日志数据。2.根据权利要求1所述的方法,其特征在于:所述日志输出格式包括当前操作类型、workId、节点信息、执行状态以及资源参数;所述日志格式解析的结果包括:请求源地址IP、请求响应服务器IP、请求时间、日志内容、日志级别、对应的代码具体类以及服务名称。3.根据权利要求1所述的方法,其特征在于:所述实时获取服务器产生的日志,通过在需收集日志的服务器上安装日志收集组件,通过配置文件配置收集日志的目录、格式解析规则和发往的ES地址,所述日志包括系统日志、应用日志、服务日志和/或自定义日志。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取用户在展示端输入的关键字然后在ES集群进行全文检索,根据检索结果可视化展示出整个操作链的结转过程、资源状态、工作状态;在所述展示端创建用户、配置加密通信及身份验证功能,分配角色和所管辖的数据索引,通过用户认证实现数据隔离。5.一种自动故障定位系统,包括:日志输出模块、日志解析模块以及日志存储模块;所述日志输出模块,用于在服务器节点上对涉及工作中心机制的异步操作定义日志...

【专利技术属性】
技术研发人员:张辉吴少威许锦源
申请(专利权)人:福建升腾资讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1