一种基于分布式体系下的系统监控方法技术方案

技术编号:37815828 阅读:14 留言:0更新日期:2023-06-09 09:45
本发明专利技术提供的一种基于分布式体系下的系统监控方法,所述系统监控方法包括:梳理应用架构;链路监控分析确定;业务监控分析确定;规划整体日志;业务监控、告警和大盘配置。采集业务系统中的业务日志,实时展现业务级的指标,例如业务的错误码、耗时、每分钟流量和成功率,从业务视角衡量业务系统的性能和稳定性,对业务的关键交易进行监控。务的关键交易进行监控。务的关键交易进行监控。

【技术实现步骤摘要】
一种基于分布式体系下的系统监控方法


[0001]本专利技术涉及系统监管领域,尤其涉及一种基于分布式体系下的系统监控方法。

技术介绍

[0002]传统的监控工具大多从基础架构、应用系统和请求等角度去衡量应用健康度,然而这些衡量指标缺乏业务语义,无法直观地体现。随着上云分布式模式大势所趋,服务器多极化分布,对于传统型监控工具无法针对分布式系统全链路跟踪,且无法从业务测监控交易情况,对运维极不友好。
[0003]目前分布式体系下的监控大多监控内容为基础资源,譬如cpu使用率、内存使用率、网络带宽等。对于有关物理配置的急性问题很有效,但对业务问题监控很少,譬如某交易成功率、交易耗时、交易最大耗时等关键信息。基于日志、指标、链路等海量数据进行多维聚合,提供业务监控、应用监控、云原生监控、基础资源监控、日志查询分析、分布式链路等多角度的可视化监测功能,有丰富的可视化大盘,并提供了告警订阅功能。以上业务信息对于业务系统有着至关重要的作用,该服务可帮助运维、研发、SRE等快速发现问题、定位问题、分析问题、解决问题,为线上系统可用率提供有效保障。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种基于分布式体系下的系统监控方法。
[0005]根据本专利技术的一个方面,提供了一种基于分布式体系下的系统监控方法,所述系统监控方法包括:
[0006]梳理应用架构;
[0007]链路监控分析确定;
[0008]业务监控分析确定;<br/>[0009]规划整体日志;
[0010]业务监控、告警和大盘配置。
[0011]可选的,所述梳理应用架构具体包括:
[0012]要进行监控的应用,拆分为多少个微服务,要监控哪个服务,该服务的上下游服务的关系,各服务之间的调用方式。
[0013]可选的,所述链路监控分析确定具体包括:
[0014]链路监控日志,是系统默认打印,只要引入SOFA链路跟踪的SDK后,会在/home/admin/logs/tracelog/*下打印相关产品或者组件的链路日志。
[0015]可选的,所述业务监控分析确定具体包括:
[0016]对整体系统进行监控,根据业务日志行数,过程结果、耗时,无需分组可配置项;
[0017]对系统中各交易或各接口或各业务进行监控,根据业务日志行数,业务类型、过程结果、耗时,根据业务类型进行分组;
[0018]对重点场景进行单独监控,根据业务中重要场景或者流量大的场景或者链路比较复杂的业务,进行单独的日志埋点,对日志进行监控配置。
[0019]可选的,所述规划整体日志具体包括:
[0020]日志内容应以特定分隔符分隔,不强制要求格式模板,但建议每一条日志,都应包括服务器时间戳、线程号、tracerId、业务跟踪号、系统跟踪号、关键业务流水号、关键入参、关键过程结果、耗时等信息,不同系统应个性增减。
[0021]可选的,所述业务日志建议具体包括:
[0022]日志输出要有主日志文件,然后根据大小或日期进行归档,监控是针对主日志文件进行;
[0023]业务通用规范日志,输出到定义的*

facede.log日志文件;
[0024]业务重点场景规范日志,建议输出到新的业务日志文件;
[0025]如果所有业务日志都输出到通用规范日志中*

facede.log,需要进行日志的整体设计,设计原则是要支持拓展,不能因为改变局部的日志格式导致以前的日志监控出问题;
[0026]错误日志是一种特殊的应用运行日志;
[0027]对于应用系统运行过程中预期外的异常,比如程序空指针、远程调用失败、数据库连接耗尽等,属于需要及时关注并介入处理的范畴,因此这类信息建议专门打印在一个日志文件中,默认输出在common

error.log中。
[0028]业务异常日志,是业务交易中已知的业务逻辑异常,定义成WARN和ERROR级别,如果定义为ERROR级别,建议1:输出到专门的日志文件,例如common

biz

error.log,要和系统异常分开;或建议2:如果都输出到common

error.log中,要输出规范结构日志,以便对系统异常和业务异常的不同策略的监控告警;
[0029]异常日志,如果是堆栈信息都打印的情况下,如果要使用自定义监控,要监控关键字,若使用行数则会不准确。
[0030]可选的,所述业务监控、告警和大盘配置具体包括:
[0031]业务监控是根据日志数据,进行的监控配置;
[0032]告警是基于监控配置中的指标,与该指标的值进行大于、小于、平均、求和、同比等比较,触发的告警消息,并通知到钉钉群中;
[0033]大盘是基于监控配置中的指标数据,进行整合形成新的报表,并把不同的报表在一个页面进行展示。
[0034]可选的,所述监控配置分为两种;一种是作为展示业务监控结果,做数据分析;另一种是要根据监控结果,做告警配置。
[0035]本专利技术提供的一种基于分布式体系下的系统监控方法,所述系统监控方法包括:梳理应用架构;链路监控分析确定;业务监控分析确定;规划整体日志;业务监控、告警和大盘配置。采集业务系统中的业务日志,实时展现业务级的指标,例如业务的错误码、耗时、每分钟流量和成功率等,从业务视角衡量业务系统的性能和稳定性,对业务的关键交易进行监控。
[0036]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0037]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0038]图1为本专利技术实施例提供的一种基于分布式体系下的系统监控方法流程图;
[0039]图2为本专利技术实施例提供的应用架构框图;
[0040]图3为本专利技术实施例提供的监控的通用逻辑流程图;
[0041]图4为本专利技术实施例提供的RMS的基本实现原理示意图。
具体实施方式
[0042]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0043]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式体系下的系统监控方法,其特征在于,所述系统监控包括:梳理应用架构;链路监控分析确定;业务监控分析确定;规划整体日志;业务监控、告警和大盘配置。2.根据权利要求1所述的一种基于分布式体系下的系统监控方法,其特征在于,所述梳理应用架构具体包括:要进行监控的应用,拆分为多少个微服务,要监控哪个服务,该服务的上下游服务的关系,各服务之间的调用方式。3.根据权利要求1所述的一种基于分布式体系下的系统监控方法,其特征在于,所述链路监控分析确定具体包括:链路监控日志,是系统默认打印,只要引入SOFA链路跟踪的SDK后,会在/home/admin/logs/tracelog/*下打印相关产品或者组件的链路日志。4.根据权利要求1所述的一种基于分布式体系下的系统监控方法,其特征在于,所述业务监控分析确定具体包括:对整体系统进行监控,根据业务日志行数,过程结果、耗时,无需分组可配置项;对系统中各交易或各接口或各业务进行监控,根据业务日志行数,业务类型、过程结果、耗时,根据业务类型进行分组;对重点场景进行单独监控,根据业务中重要场景或者流量大的场景或者链路比较复杂的业务,进行单独的日志埋点,对日志进行监控配置。5.根据权利要求1所述的一种基于分布式体系下的系统监控方法,其特征在于,所述规划整体日志具体包括:日志内容应以特定分隔符分隔,不强制要求格式模板,但建议每一条日志,都应包括服务器时间戳、线程号、tracerId、业务跟踪号、系统跟踪号、关键业务流水号、关键入参、关键过程结果、耗时等信息,不同系统应个性增减。6.根据权利要求5所述的一种基于分布式体系下的系统监控方法,其特征在于,所述业务日志建议具体包括:日志输出要有主日志文件,然后根据大小或日期进行归档,监控是针对主日志文件进行;业务通用规范日志,输出到定义的*

facede...

【专利技术属性】
技术研发人员:靳宝
申请(专利权)人:天津银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1