业务端到端性能监控方法及装置制造方法及图纸

技术编号:19751165 阅读:36 留言:0更新日期:2018-12-12 05:45
本发明专利技术实施例提供一种业务端到端性能监控方法及装置,其中,方法包括:每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据;根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库;每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标。本发明专利技术实施例能对业务端到端性能进行主动、准确、稳定、实时的监控,使后续可以对故障进行快速诊断及准确定位。

【技术实现步骤摘要】
业务端到端性能监控方法及装置
本专利技术涉及互联网
,尤其涉及一种业务端到端性能监控方法及装置。
技术介绍
随着云计算和互联网高速发展,业务越来越多,机器数量呈现十倍以致几十倍快速增长,系统架构也越来越复杂,新技术带来了投资降低、性能提升、资源共享、弹性扩展和快速部署等优势,但同时也给我们运维管理工作带来了新的挑战与思考,传统业务监控模式已经难以满足云化后要求,急需引入新的运维思路、方法提升服务质量和运维效率。目前,传统业务监控模式包括:代理方式和日志方式。代理方式是一种在“IOE”架构下比较典型的基于点的“竖井式”系统完好性业务监控模式,通过在目标主机上逐个部署后台脚本来定时采集系统中央处理器CPU、内存和存储等资源使用以及业务日志数据等信息传送到集中监控平台进行分析和呈现。日志方式是在应用程序中关键调用环节增加日志打印日志方式,将采集到数据输出到监控平台后进行集中分析和呈现。但是,由于云化后所需监控机器数量越来越多,代理方式在自动化程度、效率、灵活性、稳定性、实时性和安全管控等方面都存在严重问题,监控数据无法关联,需要人为做大量的日志分析和问题定位,故障定位过程复杂,效率低。而日志方式虽然能实现服务组件间日志关联,但和业务强耦合,且应用改造工作量大,数据输出存在延迟,很难实现全部业务覆盖,同时日志方式会影响业务性能,给系统稳定性带来很大隐患。另外,在系统运维方面,传统业务监控模式下是一种被动处理方式,出现故障时,运维人员一般采用拉网式排查,通过搜集各主机性能相关日志,进行汇聚分析和问题排查,这种方式更多依靠个人经验,一旦遇到辣手问题很难定位。鉴于此,如何对业务端到端性能进行主动、准确、稳定、实时的监控成为目前需要解决的技术问题。
技术实现思路
为解决上述的技术问题,本专利技术实施例提供一种业务端到端性能监控方法及装置,能够对业务端到端性能进行主动、准确、稳定、实时的监控,使后续可以对故障进行快速诊断及准确定位。第一方面,本专利技术实施例提供一种业务端到端性能监控方法,包括:每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据;根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库;每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标。可选地,所述根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录,包括:根据预设业务配置中的应用协议,利用数据解码引擎对所述原始数据进行协议解码,将所述原始数据转换为分散的原始交易报文;根据所述原始交易报文中的TCP会话标识,通过流处理,将所述原始交易报文中的不同服务组件的交易进行会话关联,将会话关联后的交易记录汇聚成完整的原始业务交易记录;根据所述原始业务交易记录中的关键标识,将不同服务组件的交易记录进行跨组件交易关联,将跨组件交易关联后的交易记录汇聚成一个完整业务全流程交易记录的调用视图;将所述完整业务全流程交易记录转换成用于进行前台展示的格式后存储到数据库。可选地,所述性能指标,包括:单位时间内交易量、单位时间内成功率、平均响应时间、响应率、基线、告警阈值;其中,所述单位时间内交易量为每个服务组件单位时间内接收到的交易请求数量;所述单位时间内成功率是根据每笔交易所返回的业务处理结果中携带的返回码来判断成功交易数和交易响应数后,通过所述第一公式计算得到的;所述平均响应时间是通过在完整业务全流程交易记录中解析出每一笔业务的报文请求时间和报文返回时间后,通过所述第二公式计算得到的;所述响应率是通过所述第三公式计算得到的;所述基线是通过流处理技术,采用加权移动平均值算法,通过第四公式计算得到的;所述告警阈值是根据实际情况预先设置的;所述第一公式为:所述第二公式为:所述第三公式为:所述第四公式为:其中,i=1,2,…,n,n为计算周期,wi为第i分钟的某一性能指标,xi为第i分钟所述某一性能指标的权数,为所述计算周期内所述某一性能指标的加权平均值。可选地,在所述获取每个服务组件当前的性能指标之后,所述方法还包括:将每个服务组件当前的性能指标存储到数据库,并根据每个服务组件当前的性能指标和所述数据库中存储的历史性能指标,生成每个服务组件的性能趋势报告,将所述性能趋势报告进行前台展示或者发送给运营管理系统BOMC平台。可选地,在所述获取每个服务组件当前的性能指标之后,所述方法还包括:针对任一服务组件,若判断获知该服务组件当前的性能指标大于等于该服务组件的预设告警阈值,则在预设第三时间段内进行告警提示。可选地,在所述每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据之前,所述方法还包括:进行业务配置。可选地,所述进行业务配置,包括:根据业务的系统部署逻辑图,梳理出业务访问关系视图;获取业务下每个服务组件的样本数据,根据预先配置的访问控制规则,对所述样本数据过滤后存储到数据库;基于源地址、目标地址和端口,对过滤后的样本数据中各个服务组件间的调用关系进行分析,生成服务路径图;根据所述服务路径图,将不同服务组件按照业务用途归类到服务服务组件下,并按照调用层次排序,生成业务整体监控视图。第二方面,本专利技术实施例提供一种业务端到端性能监控装置,包括:第一获取模块,用于每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据;处理模块,用于根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库;第二获取模块,用于每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标。第三方面,本专利技术实施例提供一种电子设备,包括:处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序;其中,所述处理器,存储器通过所述总线完成相互间的通信;所述处理器执行所述计算机程序时实现上述方法。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,所述存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。由上述技术方案可知,本专利技术实施例的业务端到端性能监控方法及装置,通过每隔预设第一时间段通过TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据,根据预设业务配置对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库,每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标,由此,能够对业务端到端性能进行主动、准确、稳定、实时的监控,使后续可以对故障进行快速诊断及准确定位。附图说明图1为本专利技术一实施例提供的一种业务端到端性能监控方法的流程示意图;图2为本专利技术实施例提供的一种系统部署逻辑图;图3为本专利技术实施例提供的一种业务访问关系视图;图4为本专利技术实施例提供的一种业务整体监控视图;图5为本专利技术实施例提供的一种将原始数据转换为分散的原始交易报文的示意图;图6为本专利技术实施例提供的一种完整的原始业务交易记录的示意图;图7为本专利技术实施例提供的一种完整业务全本文档来自技高网
...

【技术保护点】
1.一种业务端到端性能监控方法,其特征在于,包括:每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据;根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库;每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标。

【技术特征摘要】
1.一种业务端到端性能监控方法,其特征在于,包括:每隔预设第一时间段,通过分路器TAP获取所有服务组件的网络数据,根据预先配置的访问控制规则,对所述网络数据依次进行过滤、重排,生成原始数据;根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录并存储到数据库;每隔预设第二时间段,根据所述数据库里存储的所述完整业务全流程交易记录,获取每个服务组件当前的性能指标。2.根据权利要求1所述的方法,其特征在于,所述根据预设业务配置,对所述原始数据进行处理,获得完整业务全流程交易记录,包括:根据预设业务配置中的应用协议,利用数据解码引擎对所述原始数据进行协议解码,将所述原始数据转换为分散的原始交易报文;根据所述原始交易报文中的TCP会话标识,通过流处理,将所述原始交易报文中的不同服务组件的交易进行会话关联,将会话关联后的交易记录汇聚成完整的原始业务交易记录;根据所述原始业务交易记录中的关键标识,将不同服务组件的交易记录进行跨组件交易关联,将跨组件交易关联后的交易记录汇聚成一个完整业务全流程交易记录的调用视图;将所述完整业务全流程交易记录转换成用于进行前台展示的格式后存储到数据库。3.根据权利要求1所述的方法,其特征在于,所述性能指标,包括:单位时间内交易量、单位时间内成功率、平均响应时间、响应率、基线、告警阈值;其中,所述单位时间内交易量为每个服务组件单位时间内接收到的交易请求数量;所述单位时间内成功率是根据每笔交易所返回的业务处理结果中携带的返回码来判断成功交易数和交易响应数后,通过所述第一公式计算得到的;所述平均响应时间是通过在完整业务全流程交易记录中解析出每一笔业务的报文请求时间和报文返回时间后,通过所述第二公式计算得到的;所述响应率是通过所述第三公式计算得到的;所述基线是通过流处理技术,采用加权移动平均值算法,通过第四公式计算得到的;所述告警阈值是根据实际情况预先设置的;所述第一公式为:所述第二公式为:所述第三公式为:所述第四公式为:其中,i=1,2,…,n,n为计算周期,wi为第i分钟的某一性能指标,xi为第i分钟所述某一性能指标的权数,为所述计算周期内所述某一性能指标的加权平均值。4.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:王新安
申请(专利权)人:中国移动通信集团公司中国移动通信集团山东有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1