云平台监控方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27776086 阅读:28 留言:0更新日期:2021-03-23 13:15
本申请涉及一种云平台监控方法、装置、计算机设备和存储介质。所述方法包括:采集多层次系统的待监控数据;采用预设的深度学习算法,对多层次系统的待监控数据进行故障分析,得到多层次系统的故障信息;根据多层次系统的故障信息,生成告警信息。采用本方法能够根据得到的多层次系统的故障信息,及时地生成多层次系统故障的告警信息,对多层次系统的故障进行及时有效地处理。

【技术实现步骤摘要】
云平台监控方法、装置、计算机设备和存储介质
本申请涉及监控
,特别是涉及一种云平台监控方法、装置、计算机设备和存储介质。
技术介绍
监控系统是度量和管理互联网技术(InternetTechnology,IT)的系统,监控系统可以在业务价值与系统或应用程序的产生之间提供转换,监控系统将这些指标转换为可度量的参考值为业务提供反馈,供用户进行参考,因此监控系统具有极其重要的应用价值。传统技术中,监控系统一般是一个独立的系统,开发和运维隔离,监控系统缺少与PaaS平台的高度整合乃至于融合,监控系统采集例如服务器的资源使用率,应用服务的服务状态等数据,监控系统通过设置对应的指标阈值等相关告警测量,当被监控对象达到设置的阈值的时候,监控系统生成告警信息。但是,传统的监控方法,存在无法及时生成告警信息的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够及时生成告警信息的云平台监控方法、装置、计算机设备和存储介质。一种云平台监控方法,所述方法包括:采集多层次系统的待监控数据;采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;根据所述多层次系统的故障信息,生成告警信息。在其中一个实施例中,所述根据所述多层次系统的故障信息,生成告警信息,包括:在预设的时间窗口内,对各所述故障信息中的相同故障信息进行合并,得到合并后的故障信息;根据所述合并后的故障信息,生成所述告警信息。在其中一个实施例中,所述根据所述多层次系统的故障信息,生成告警信息,包括:对各所述故障信息进行关联聚合,得到聚合后的故障信息;根据所述聚合后的故障信息,生成所述告警信息。在其中一个实施例中,所述故障信息包括故障产生的层级;所述对各所述故障信息进行关联聚合,得到聚合后的故障信息,包括:根据各所述故障产生的层级,将层间故障信息中的上层故障信息合并到下层故障信息,得到所述聚合后的故障信息;其中,所述上层故障信息表征的故障为所述下层故障信息表征的故障所引起的。在其中一个实施例中,所述故障信息包括故障产生的层级;所述对各所述故障信息进行关联聚合,得到聚合后的故障信息,包括:根据各所述故障产生的层级,将层内故障信息中的多个故障信息合并为单条故障信息,得到所述聚合后的故障信息。在其中一个实施例中,所述方法还包括:利用分类模型,对所述告警信息进行分类,得到分类后的告警信息;按照所述分类后的告警信息对应的类别,下发所述分类后的告警信息。在其中一个实施例中,所述下发所述分类后的告警信息,包括:利用预设的通知方式,下发所述分类后的告警信息;所述预设的通知方式包括:短信、邮件、电话和及时通信。在其中一个实施例中,所述方法还包括:获取各所述故障信息对应的处理方法,并下发各所述故障信息对应的处理方法。一种云平台监控装置,所述装置包括:采集模块,用于采集多层次系统的待监控数据;分析模块,用于采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;告警模块,用于根据所述多层次系统的故障信息,生成告警信息。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:采集多层次系统的待监控数据;采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;根据所述多层次系统的故障信息,生成告警信息。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:采集多层次系统的待监控数据;采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;根据所述多层次系统的故障信息,生成告警信息。上述云平台监控方法、装置、计算机设备和存储介质,通过预设的深度学习算法能够对采集的多层次系统的待监控数据进行统一地故障分析,确保能够发现各层次系统的异常,得到多层次系统的故障信息,从而可以根据得到的多层次系统的故障信息,及时地生成多层次系统故障的告警信息,对多层次系统的故障进行及时有效地处理。附图说明图1为一个实施例中云平台监控方法的流程示意图;图2为另一个实施例中云平台监控方法的流程示意图;图3为另一个实施例中云平台监控方法的流程示意图;图4为另一个实施例中云平台监控方法的流程示意图;图5为一个实施例中云平台监控装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。传统技术中,对于医疗行业没有特定的监控方法,大多采用被动式的监控方式,基本过程如下:1)监控系统采集例如服务器的资源使用率,应用服务的服务状态等数据;2)运维人员通过监控系统设置对应的指标阈值等相关的告警策略;3)被监控对象达到设置的阀值的时候,监控系统发送告警;4)运维人员收到告警,并通过监控系统查看监控数据,分析处理告警。这种监控告警方式在医疗领域的小型IT设施以及简单应用情况下能基本满足监控的要求,但是,随着云计算技术的深入发展以及云原生PaaS平台的出现,医疗行业也正在向云原生架构迁移,需要监控的主机越来越多,常常比往常多一个甚至几个数量级,随着主机数量增多以及基础设施更加复杂,传统的监控方法各方面都开始出现很多问题,跟踪主机状态变得更加困难,应用程序微服务拆分以及业务也变得更加复杂,对可用性和质量的期望变得更高,应用告警通知堆积如山,告警无法得到及时有效的处理。在一个实施例中,如图1所示,提供了一种云平台监控方法,以该方法应用于PaaS平台为例进行说明,包括以下步骤:S101,采集多层次系统的待监控数据。具体地,PaaS平台采集多层次系统的待监控数据。这里需要说明的是,云计算包括三个层次的服务:基础架构即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS),PaaS则提供了基础架构,软件开发者可以在这个基础架构之上建设新的应用,或者扩展已有的应用,同时却不必购买开发、质量控制或生产服务器,本申请实施例中的PaaS平台为集成有Prometheus组件,按照基础监控、集群监控、服务监控、功能监控、业务指标监控的多维度方式配置监控项目所搭建的平台,其中,基础监控用于监控服务器是否宕机,CPU、磁盘、内存、GPU等资源的使用率以及网络质量等;集群监控用于对kubernetes组件、器运行时环境docker监控、域名监控等;服务监控用于对PaaS中的中间件服务如数据库、缓存、ES等进行监控;功能监控用于对页面以及接口进行监控;业务指本文档来自技高网...

【技术保护点】
1.一种云平台监控方法,其特征在于,所述方法包括:/n采集多层次系统的待监控数据;/n采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;/n根据所述多层次系统的故障信息,生成告警信息。/n

【技术特征摘要】
1.一种云平台监控方法,其特征在于,所述方法包括:
采集多层次系统的待监控数据;
采用预设的深度学习算法,对所述多层次系统的待监控数据进行故障分析,得到所述多层次系统的故障信息;
根据所述多层次系统的故障信息,生成告警信息。


2.根据权利要求1所述的方法,其特征在于,所述根据所述多层次系统的故障信息,生成告警信息,包括:
在预设的时间窗口内,对各所述故障信息中的相同故障信息进行合并,得到合并后的故障信息;
根据所述合并后的故障信息,生成所述告警信息。


3.根据权利要求1所述的方法,其特征在于,所述根据所述多层次系统的故障信息,生成告警信息,包括:
对各所述故障信息进行关联聚合,得到聚合后的故障信息;
根据所述聚合后的故障信息,生成所述告警信息。


4.根据权利要求3所述的方法,其特征在于,所述故障信息包括故障产生的层级;所述对各所述故障信息进行关联聚合,得到聚合后的故障信息,包括:
根据各所述故障产生的层级,将层间故障信息中的上层故障信息合并到下层故障信息,得到所述聚合后的故障信息;其中,所述上层故障信息表征的故障为所述下层故障信息表征的故障所引起的。


5.根据权利要求3所述的方法,其特征在于,所述故障信息包括故障产生的层级;所述对各所述故障信息进行关联聚合,得到聚合后的故障信息,包括:
根据各所述故障产生的层级,将层内故障信息中的多个故...

【专利技术属性】
技术研发人员:鲁成李春祝
申请(专利权)人:武汉联影医疗科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1