一种监测部署于云平台的应用运行质量的无侵入仿真方法技术

技术编号:25438840 阅读:22 留言:0更新日期:2020-08-28 22:27
本发明专利技术公开了一种监测部署于云平台的应用运行质量的无侵入仿真方法,属于云计算技术领域,该方法通过在同一平台建立外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计算、存储和网络的运行质量指标进行收集,实现基于租户具体应用的运行质量监测。本发明专利技术的实质是对云平台的个性化质量监测,以租户应用为验证样本,解决了云服务商只能提供云平台整体SLA,无法针对具体租户提供服务质量体验的问题。实现了没有授权无法在租户应用使用服务实例内部署探针的前提下,提供个性化的使用体验监测方案。

【技术实现步骤摘要】
一种监测部署于云平台的应用运行质量的无侵入仿真方法
本专利技术涉及云计算
,具体地说是一种监测部署于云平台的应用运行质量的无侵入仿真方法。
技术介绍
基于云计算的云服务产品已成为IT的主流资源支撑方案,上云、用云也代替了传统使用模式和运维模式,服务商主导云资源提供和服务,租户使用云资源。随着上云业务的扩大,当前的主要矛盾已经从“服务于使用”转向“服务于体验”。客户对运行在云上的应用,质量要求越来越高,经常会因为打开延迟、性能降低等问题投诉云服务商。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种监测部署于云平台的应用运行质量的无侵入仿真方法,能够实现在没有授权的前提下,不通过侵入租户使用的资源,为租户提供更好的云资源服务,实现个性化的使用体验保障。本专利技术解决其技术问题所采用的技术方案是:一种监测部署于云平台的应用运行质量的无侵入仿真方法,通过在同一平台建立外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计算、存储和网络的运行质量指标进行收集,实现基于租户具体应用的运行质量监测。因云平台服务商没有客户资源的操作权限,通过建立外部仿真环境模拟租户的使用体验。从应用可用性、平台、计算、存储和网络5各方面构造运行在云平台上的无侵入的租户应用运行质量仿真检测,以应用为对象,实质体现了整个云平台的运行质量,使运维方式从整体的粗放型到应用的个性化保障,既解决了应用可用性问题,也解决了应用不可用时的可能原因。优选的,所述应用可用性的运行质量指标收集包括应用云外访问质量指标的采集获取和应用云内访问质量指标的采集获取,应用云外访问,模拟使用者通过浏览器打开应用访问的操作,用命令来仿真测试应用的运行质量,仿真命令支持常用的IE(v8及以上版本)、Google、火狐等浏览器,仿真命令执行的结果是应用运行质量的直接体现;指标包括NDS解析时长、TCP协议建立时长、系统白屏时长、首页显示时长和下载速度;采集方式以HTTP协议为基础,结合返回码确认,采集命令自动适应3XX的重定向等情况,并判断4XX、5XX为异常返回值,当出现异常时,再使用其他环节结果辅助判断故障原因,如云内访问、计算、存储、网络等质量;为了减少应用监测的异常告警,特别是网络质量造成的访问延迟告警,还优化了告警机制,本方法以监测应用为区分对象,把当前网络质量时延及该应用正常访问时长做算法处理获得门限值APP-Time,当监测的访问时长超出APP-Time时再发出异常告警;应用首页加载时长,设置动态门限值APP-Time,通过函数F(应用正常访问时长,当前网络延迟时长)计算获得;应用云内访问,把仿真检测程序部署到网络节点上,在租户VLAN网关内部做仿真测试,能够获得较真实的监测结果;云内应用仿真拨测可以根据结构情况,跳过DNS环节,直接使用云内地址(至少是可访问的FloatingIP地址)进行HTTP协议的探测,指标包括连接建立时长、系统白屏时长、首页显示时长和下载速度;应用拨测返回码异常,或者访问超时都会以告警方式通知,算法和实现参考云外部分。优选的,云平台质量指标的采集获取,通过在nail内部的采集进程,周期性调用网卡元数据接口和端口元数据接口计算,并评估信息获取的完整性和时延,以评价云平台支撑能力质量。该指标在nail(客户端)的判断策略里实现,如果异常则上传到wall(服务端)统一管理并告警。进一步的,以云平台的宿主机为单位建立原子性载体nail,承担计算、存储、网络质量的仿真监测功能,监测方案中功能实现采用两级体制,执行单元为nail,管理单元为wall;nail由虚拟化平台统一关键并管理,以便能更直观体现虚拟化平台的运行情况,如云平台运行波动、延迟等;nail所在在宿主机故障后,不需要疏散到其他宿主机上;nail内部安装用于监测的程序,监测策略由集中管理系统wall统一管理,并建立通道,交互相关信息;按照心跳机制nail周期性向wall汇报自己的存活状态,wall在规定周期内收不到nail的汇报,根据个数情况,判断是宿主机问题,还是云平台群体性问题;nail发起的连通性监测对象及监测策略,由wall判断并下发;nail发起的存储IO监测方式,如顺序读/写,随机读/写,以及数据块的大小,根据监测需要可定制化调整并下发;nail发起的点到点之间数据包传输监测策略,由wall配置并下发。优选的,对于计算质量指标的采集获取,从宿主机的角度判断对其上虚拟机的支撑能力,指标包括CPU和内存的资源支撑能力、CPU因IO不及时造成的中断等待次数以及CPU处理任务的排队长度;通过nail执行云平台操作控制节点的数据接口,监测自该点发起的平台访问可达性,为其他访问可达性做仿真性验证;收集并反馈nail在宿主机的CPU、内存、本地硬盘的利用率,及vCPU、内存的分配率,异常信息以告警形式通知。优选的,对于存储质量指标的采集获取,通过在nail中部署对文件和数据库两类方式的探测程序,对底层存储的运行质量进行监测,并从部署的应用上做仿真访问,判断IO是否影响了正常运行;文件性能指标,通过在nail部署的程序按照监测策略,反复操作一个文件体,获取相关性能指标;数据库性能指标,除获取数据库的QPS、TPS外,还对指定数据库表的数据用SQL语句查询获取,记录查询这些固定数据的耗时,用来验证当前数据库可用,并且查询数据库的速度是否正常。文件与云平台存储资源池之间的IO质量监测,包括顺序读写、随机读写的延时、抖动及IOPS等性能指标;数据库与云平台存储资源池之间的IO质量监测,包括QPS和TPS等性能指标。对监测的性能指标可以设置门限值,异常数据以告警方式通知到集中管理wall;除性能指标外,在文件和数据库与存储交互过程中产生的错误日志,也将以告警的方式发送到集中管理系统wall。优选的,对于网络质量指标的采集获取,通过存在的物理同路由事实仿真测试同应用内部不同虚机的互访质量。通过部署于nail内的agent,可以实现TCP、HTTP、ICMP等协议的网络质量探测,也可以使用traceroute等跟踪经过的路由及质量情况。该操作可以识别同应用内受网络质量影响的响应时延。通过仿真监测可以实现同应用内部不同虚机间的丢包、错误、时延、目标不可达等问题。在同宿主机上把nail配置为透明模式,把需要分析虚机的数据流量引到nail的指定端口上,并通过指定源IP、PORT或目标IP、PORT,结合传输协议等辅助条件,获取对应的数据包并进行分析发现网络连接不成功的具体原因,或者长时间执行的程序语句内容。进一步的,根据CMDB自动化增加新监测对象和策略,云服务商开通资源后,根据设置的用途信息,自动形成应用内部拓扑关系;根据拓扑关系自动形成监测点,如web到app,app到db之间的网络时延、抖动等质量,并可根据应用特点个性化设置门本文档来自技高网...

【技术保护点】
1.一种监测部署于云平台的应用运行质量的无侵入仿真方法,其特征在于,通过在同一平台建立外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计算、存储和网络的运行质量指标进行收集,实现基于租户具体应用的运行质量监测。/n

【技术特征摘要】
1.一种监测部署于云平台的应用运行质量的无侵入仿真方法,其特征在于,通过在同一平台建立外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计算、存储和网络的运行质量指标进行收集,实现基于租户具体应用的运行质量监测。


2.根据权利要求1所述的一种监测部署于云平台的应用运行质量的无侵入仿真方法,其特征在于,所述应用可用性的运行质量指标收集包括应用云外访问质量指标的采集获取和应用云内访问质量指标的采集获取,
应用云外访问,模拟使用者通过浏览器打开应用访问的操作,用命令来仿真测试应用的运行质量,仿真命令执行的结果是应用运行质量的直接体现;指标包括NDS解析时长、TCP协议建立时长、系统白屏时长、首页显示时长和下载速度;
应用云内访问,把仿真检测程序部署到网络节点上,在租户VLAN网关内部做仿真测试;指标包括连接建立时长、系统白屏时长、首页显示时长和下载速度。


3.根据权利要求1所述的一种监测部署于云平台的应用运行质量的无侵入仿真方法,其特征在于,云平台质量指标的采集获取,通过在nail内部的采集进程,周期性调用网卡元数据接口和端口元数据接口计算,并评估信息获取的完整性和时延,以评价云平台支撑能力质量。


4.根据权利要求3所述的一种监测部署于云平台的应用运行质量的无侵入仿真方法,其特征在于,以云平台的宿主机为单位建立原子性载体nail,nail内部安装用于监测的程序,监测策略由集中管理系统wall统一管理,并建立通道,交互相关信息;
按照心跳机制nail周期性向wall汇报自己的存活状态,wall在规定周期内收不到nail的汇报,根据个数情况,判断是宿主机问题,还是云平台群体性问题;
nail发起的连通性监测对象及监测策略,由wall判断并下发;
nail发起的存储IO监测方式,以及数据块的大小,根据监测需要可定制化调整并下发;
nail发起的点到点之间数据包传输监测策略,由wall配置并下发。


5.根据权利要求1或3或4所述的...

【专利技术属性】
技术研发人员:祝乃国
申请(专利权)人:山东汇贸电子口岸有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1