一种大数据系统服务性能的监测方法、装置及服务器制造方法及图纸

技术编号:18053856 阅读:19 留言:0更新日期:2018-05-26 10:37
一种大数据系统服务性能的监测方法、装置及服务器,监测装置接收系统中服务器发送的服务性能参数测量值的分桶信息,分桶信息包括在设定时间段落入各个取值区间内的测量值的数量,各个取值区间是对服务性能参数的取值范围划分得到的;监测装置分别统计各个取值区间内的测量值的合计数,按照各个取值区间在取值范围内的排列顺序对各个取值区间内的测量值的合计数进行依次累计,确定累计数达到目标数时累计到的取值区间;从累计到的取值区间中选一个值作为服务性能参数的监测值。本申请可以节约网络资源,运算量小。

【技术实现步骤摘要】
一种大数据系统服务性能的监测方法、装置及服务器
本专利技术涉及大数据技术,更具体地,涉及一种大数据系统服务性能的监测方法、监测装置及服务器。
技术介绍
服务等级协议(SLA:Service-LevelAgreement的缩写)是国际通行的客户/服务评估标准,是网络服务供应商和客户之间签署的一份法律文件。该文件承诺只要用户向服务供应商支付相应服务费用,就应享受到服务供应商提供的相应服务。服务提供者可能是一个国内的IT组织、一个应用程序服务提供者、一个网络服务提供者或者任何其他类型的服务提供者。随着更多的商业应用在Internet的广泛开展,越来越需要SLA对性能作出保障。SLA的保障是以一系列的服务等级目标(SLO)的形式定义的。服务等级目标是一个或多个有限定的服务组件的测量的组合。SLO被实现是指那些有限定的组件的测量值在限定范围里。例如,SLA中,服务提供者保证它提供的服务在一定百分比(如99.9%)的时间内是可用的,则因特网服务提供者需要保证网络连通率一年内不低于99.9%,每月不联通时间少于44分钟。而如果支持99.99%或99.999%有效工作时间,意味着更高的服务品质。SLA需要具有“可监测性”并提供“监测方法”。尤其是在大数据量的情况下,如何对服务性能参数进行监测,是SLA的重要内容。在管理的服务器数量很多,业务请求量很大的情况下,对系统的对服务性能参数进行监测是一件很有挑战的事情。系统中服务器对业务请求的处理延迟(latency)是体现其服务品质的重要参数。以对大数据系统业务请求的处理延迟的监测为例,假定在某一时间段系统中的服务器一共处理了10000次业务请求,这些业务请求的处理延迟分别是1ms,2ms,3ms,4ms,……,9999ms,10000ms,此时需要基于这10000次业务请求的处理延迟统计业务请求的处理延迟的监测值,来评估系统对业务请求的处理延迟的水平。其中的一种方法是基于SLA约定的服务等级标准来计算,假定SLA约定的服务等级标准为99.99%,则业务请求的延迟时间的监测值为9999ms,也就是说,系统对99.99%的业务请求的处理延迟小于等于该监测值,如果SLA中进一步约定了在99.99%的服务等级标准下系统对业务请求的处理延迟为9999ms,则说明达到SLA的要求,如果约定的系统对业务请求的处理延迟为9990ms,则说明没有达到SLA的要求。当然,实际系统中业务请求的处理延迟不可能是均布的,为了监测系统对业务请求的处理延迟,相关技术中,系统中的服务器需要将测量的所有业务请求的处理延迟发送到系统中设置的监测装置,监测装置需要将所有的数据汇总后进行统计,如将所有业务请求的处理延迟从小到大排序(或从大到小排序)后,将序列中的第9999个(或第2个)处理延迟作为系统对业务请求的处理延迟的监测值。这种监测方法非常浪费带宽和计算能力。按照大数据系统中有30万台服务器提供查询服务的情况,每台服务器每秒查询率(qps)为1000次/s(即每秒接受1000次查询)计算,则30万台服务器总共需要发送3亿次对查询请求的处理延迟,而监测装置需要对3亿次查询的处理延迟进行排序,不光难度大,浪费资源,还容易出现溢出的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种大数据系统服务性能的监测方法,应用于监测装置,包括:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序对所述各个取值区间内的测量值的合计数进行依次累计,确定累计数达到目标数时累计到的取值区间;从所述累计到的取值区间中选一个值作为所述服务性能参数的监测值。本专利技术实施例还提供了一种服务性能的监测方法,应用于大数据系统中的服务器,包括:获取服务性能参数的测量值;统计在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;将所述设定时间段落入各个取值区间内的测量值的数量发送至所述系统的监测装置。本专利技术实施例还提供了一种大数据系统服务性能的监测装置,包括:接收模块,设置为:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;计算模块,设置为:分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序依次累计所述各个取值区间内的测量值的合计数,确定累计数达到目标数时累计到的取值区间;确定模块,设置为:将所述累计到的取值区间中的一个值确定为所述服务性能参数的监测值。本专利技术实施例还提供了一种大数据系统服务性能的监测装置,包括处理器和存储器,其中:所述存储器设置为:存储程序代码;所述处理器设置为:读取所述存储器存储的程序代码以执行以下处理:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序对所述各个取值区间内的测量值的合计数进行依次累计,确定累计数达到目标数时累计到的取值区间;将所述累计到的取值区间中的一个值作为所述服务性能参数的监测值。本专利技术实施例还提供了一种大数据系统中的服务器,包括性能监测模块,其中,所述性能监测模块包括:获取单元,设置为:获取服务性能参数的测量值;统计单元,设置为:统计在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;发送单元,设置为:将所述设定时间段落入各个取值区间内的测量值的数量发送至所述系统的监测装置。本专利技术实施例还提供了一种大数据系统中的服务器,包括处理器和存储器,其中:所述存储器设置为:存储程序代码;所述处理器设置为:读取所述存储器存储的程序代码以执行以下处理:获取服务性能参数的测量值;统计在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;将所述设定时间段落入各个取值区间内的测量值的数量,发送至所述系统的监测装置。上述方案服务器只需要发送少量取值区间内测量值的数量,无需发送大量的测量值,可以节约网络资源,而监测装置也只需要对少量的取值区间排序后得到测量值,处理的数据量大大减少,因而运算量小,不会出现溢出等问题。附图说明图1是本专利技术实施例一监测装置侧的服务性能监测方法的流程图;图2是本专利技术实施例一监测装置的模块图;图3是本专利技术实施例二监服务器侧的服务性能监测方法的流程图;图4是本专利技术实施例二服务器中性能监测模块的单元图;图5是本专利技术应用示例服务性能监测方法的流程图;图6是本专利技术应用示例取值区间划分及排列的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。本文档来自技高网
...
一种大数据系统服务性能的监测方法、装置及服务器

【技术保护点】
一种大数据系统服务性能的监测方法,应用于监测装置,包括:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序对所述各个取值区间内的测量值的合计数进行依次累计,确定累计数达到目标数时累计到的取值区间;从所述累计到的取值区间中选一个值作为所述服务性能参数的监测值。

【技术特征摘要】
1.一种大数据系统服务性能的监测方法,应用于监测装置,包括:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序对所述各个取值区间内的测量值的合计数进行依次累计,确定累计数达到目标数时累计到的取值区间;从所述累计到的取值区间中选一个值作为所述服务性能参数的监测值。2.如权利要求1所述的监测方法,其特征在于:所述目标数按照以下方式计算:将所有取值区间内的测量值的合计数相加,得到的和再与一比例系数相乘,得到的积为所述目标数;其中,所述比例系数根据服务等级协议SLA约定的服务等级标准确定。3.如权利要求1或2所述的监测方法,其特征在于:所述各个取值区间的大小不同,在所述取值范围内,所述监测值落入概率越大的区域划分的取值区间越小。4.所如权利要求1或2所述的监测方法,其特征在于:所述服务性能参数包括服务器对业务请求的处理延迟。5.一种服务性能的监测方法,应用于大数据系统中的服务器,包括:获取服务性能参数的测量值;统计在设定时间段落入各个取值区间内的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;将所述设定时间段落入各个取值区间内的测量值的数量发送至所述系统的监测装置。6.如权利要求5所述的监测方法,其特征在于:所述获取服务性能参数的测量值,包括:获取所有用户或指定用户的服务性能参数的测量值;所述服务性能参数包括服务器对业务请求的处理延迟。7.如权利要求5或6所述的监测方法,其特征在于:所述各个取值区间的大小不同,在所述取值范围内,所述监测值落入概率越大的区域划分的取值区间越小。8.一种大数据系统服务性能的监测装置,其特征在于,包括:接收模块,设置为:接收系统中服务器发送的服务性能参数测量值的分桶信息,所述分桶信息包括在设定时间段落入各个取值区间的测量值的数量,所述各个取值区间是对所述服务性能参数的取值范围划分得到的;计算模块,设置为:分别统计所述各个取值区间内的测量值的合计数,按照所述各个取值区间在所述取值范围内的排列顺序依次累计所述各个取值区间内的测量值的合计数,确定累计数达到目标数时累计到的取值区间;确定模块,设置...

【专利技术属性】
技术研发人员:林江彬王勇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1