一种监控系统及其方法技术方案

技术编号:18355848 阅读:17 留言:0更新日期:2018-07-02 09:10
本发明专利技术属于网络监控技术领域,具体涉及一种网络运维的采用深度分析方式的监控系统及其方法。它包括配置单元、数据单元和报警单元,配置单元用于参数规则配置,并将配置的参数规则分别发送给采集客户端和异常判定模块;数据单元包括采集客户端、传输模块和数据分发模块,采集客户端用于采集数据,并把采集数据通过传输模块传输给数据分发模块,数据分发模块用于将接收到的采集数据,分发到异常判定模块进行处理;报警单元包括异常判定模块、异常数据库和报警执行模块,异常判定模块用于根据报警规则对单条监控数据进行分析后,得到异常信息,并将异常信息发送给异常数据库,报警执行模块用于获取异常数据库中的信息,执行报警。

【技术实现步骤摘要】
一种监控系统及其方法
本专利技术属于网络监控
,具体涉及一种网络运维的监控系统及其方法。
技术介绍
随着网络技术的发展,越来越多的客户都在考虑或采纳业务集群化的方案。然而业务系统集群化后,不仅增加运行维护的工作强度,而且会使系统变得更加繁杂。有效的系统和应用监控体系成为了解业务资源的使用状况,及时发现可能导致系统故障的隐患,实现系统运营保障的关键。另一方面,借助于集中监控解决方案,用户能够正确和及时地了解系统的运行状态,发现影响整体系统运行的瓶颈,帮助系统开发人员进行必要的系统优化和配置变更,甚至为系统的升级和扩容提供依据。强有力的监控和诊断工具还可以帮助运行维护人员快速地分析出应用故障原因,把他们从繁杂重复的劳动中解放出来。监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,监控系统可以事前及时预警发现故障,事后提供详实的数据用于追查定位问题。因为监控涉及运营的多个方面,所以监控系统应该要简单易用。现有的监控系统,一般采用先把数据集中储存,再对基于集中存储的数据执行判断规则,这种处理方式在数据量大的情况下,对服务器造成很大的负载压力。并且现有基于阈值规则的异常判断,无法适应运维变化,特别是对于监控指标的正常波动造成的异常,常常引起误报警。
技术实现思路
针对上述监控系统存在的不足之处,本专利技术提出了一种网络运维的监控系统及其方法。该监控方法通过采集客户端进行数据采集,并将采集到的数据,通过数据分发单元传输到不同的处理单元,进行数据处理。得到异常信息后,进行异常报警。本专利技术采用如下技术方案:一种监控系统,它包括配置模块、数据模块和报警模块,配置模块用于参数规则配置,并将配置的参数规则分别发送给采集客户端和异常判定单元;数据模块包括采集客户端、传输单元和数据分发单元,采集客户端用于采集数据,并把采集数据通过传输单元传输给数据分发单元,数据分发单元用于将接收到的采集数据,分发到异常判定单元进行处理;报警模块包括异常判定单元、异常数据库和报警执行单元,异常判定单元用于根据报警规则对单条监控数据进行分析后,得到异常信息,并将异常信息发送给异常数据库,报警执行单元用于获取异常数据库中的信息,执行报警。进一步的,异常判定单元的部署环境为集群化部署。进一步的,数据模块还包括数据归集单元,数据分发单元将接收到的采集数据分发给数据归集单元,数据归集单元用于将采集到的多维数据根据合并项目规则对数据进行归集处理,并将处理后的数据返回给数据分发单元。进一步的,报警模块还包括报警反馈单元,报警反馈单元用于判断是否误报警并反馈给异常数据库。进一步的,报警模块还包括深度学习分析单元,深度学习分析单元用于分析异常数据库中的信息,并将分析结果反馈给异常数据库。一种基于上述任一项监控系统的监控方法,包括以下步骤,S1,参数规则配置,包括采集项目配置和报警规则配置,采集项目配置的参数规则发送给采集客户端,报警规则配置的参数规则发送给异常判定单元;S2,采集客户端用于采集数据,并把采集数据通过传输单元传输给数据分发单元;S3,数据分发单元将接收到的采集数据,发送到异常判定单元进行处理,异常判定单元用于根据报警规则对单条监控数据进行分析后,得到异常信息,并将异常信息发送给异常数据库;S4,报警执行单元获取异常数据库中的信息,执行报警。进一步的,步骤S3中异常判定单元的部署环境为集群化部署。进一步的,步骤S3还包括数据分发单元将接收到的采集数据分发给数据归集单元,数据归集单元根据合并项目规则对数据进行归集处理,并将处理后的数据返回给数据分发单元。进一步的,步骤S4还包括报警反馈单元判断是否误报警并反馈给异常数据库。进一步的,步骤S3还包括深度学习分析单元分析异常数据库中的信息,并将分析结果反馈给异常数据库。本专利技术相对于现有技术具有如下优点:克服了原有监控分析服务器单点处理压力过大,单点故障等问题,实时并发处理单条监控数据与分布式集群处理结构,大大提升监控数据处理效率;实现数据的归集,提前对同一监控对象的不同监控来源数据进行归集,降低异常判定单元的计算负载,提高统计性能,同时,由于采集的数据是多个维度的,使用多维数据进行异常判定,提高了异常信息的信息量,使得单个异常判定准确率更高;基于报警反馈和深度学习分析能力,能够根据运维人员的判定进行调整,同时按异常产生的趋势产生报警,提前发现问题,提供关联异常信息,提高整体异常识别的准确率,降低误报率。提供灵活界面,让运维人员可以通过查询各种数据分析查找运营中的问题。附图说明图1是本专利技术监控系统的结构图;图2是报警示意图。具体实施方式为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。现结合附图和具体实施方式对本专利技术进一步说明。参阅图1所示,为本专利技术提出一种监控系统的结构图,它包括配置模块1、数据模块2、报警模块3和显示模块4。配置模块1用于配置参数,并将配置的参数发送给对应的执行单元上。配置模块1包括规则配置单元11和配置分发单元12,规则配置单元11分为两部分:采集项目配置和报警规则配置。采集项目配置,管理不同采集客户端21需要采集的数据种类,按监控目的采集对应数据。报警规则配置,配置异常判断标准和异常通知的人员范围。配置分发单元12,用于提高配置分发效率。在全网多个地方部署,缓存配置数据库中的配置,然后将配置数据分发到对应执行单元上。数据模块2包括采集客户端21、传输单元22、数据分发单元23和数据归集单元24,采集客户端21用于采集数据,并把采集数据通过传输单元22传输给数据分发单元23,数据分发单元23用于将接收到的采集数据,分发到异常判定单元31和数据归集单元24进行处理。数据模型是否强大,是否灵活,对于监控系统至关重要。监控数据使用一个采集数据上记录多个维度数据的数据模型结构。这样可以对某个监控项目进行多维度分析,并且减少数据处理数量,提高数据存储查询效率。该实施例中监控数据结构的组成是:时间、采集数据名称、多组KV(Key-Value,键值)查询数据、多组KV采集数据。采集客户端21,提供三种采集方式。分别是:主动采集、提供API接口和插件采集支持,在采集时按一个采集数据的不同纬度赋值。主动采集,主要采集本服务器的硬件信息,目的用于监控服务器运行状态;API接口,是采集客户端21提供的给其他应用或服务上报自身状态的API接口,目的是用于应用状态的监控和测试,这个接口可以较容易实现应用监控内部探测的数值,如应用的数据库查询响应数据采集等等;插件采集,是监控平台可管理的探测扩展单元,主要用于监控其他应用和服务,这钟监控方式可以由监控配置平台统一管理下发,并且可以在配置平台上随时打开或关闭,实现统一又灵活的监控目标。传输单元22,增强了采集数据传输效率和成功率。传输单元22设计线路选优功能,配合DNS分区解析,可以搭建全球网络监控应用路由。极大提高采集数据的传输效率。传输单元22可以是传输代理单元,用于在跨运营商等网络状况不佳时,快速上传监控数据本文档来自技高网...
一种监控系统及其方法

【技术保护点】
1.一种监控系统,其特征在于:它包括配置模块、数据模块和报警模块,所述配置模块用于参数规则配置,并将配置的参数规则分别发送给采集客户端和异常判定单元;所述数据模块包括采集客户端、传输单元和数据分发单元,采集客户端用于采集数据,并把采集数据通过传输单元传输给数据分发单元,数据分发单元用于将接收到的采集数据,分发到异常判定单元进行处理;所述报警模块包括异常判定单元、异常数据库和报警执行单元,所述异常判定单元用于根据报警规则对单条监控数据进行分析后,得到异常信息,并将异常信息发送给异常数据库,所述报警执行单元用于获取异常数据库中的信息,执行报警。

【技术特征摘要】
1.一种监控系统,其特征在于:它包括配置模块、数据模块和报警模块,所述配置模块用于参数规则配置,并将配置的参数规则分别发送给采集客户端和异常判定单元;所述数据模块包括采集客户端、传输单元和数据分发单元,采集客户端用于采集数据,并把采集数据通过传输单元传输给数据分发单元,数据分发单元用于将接收到的采集数据,分发到异常判定单元进行处理;所述报警模块包括异常判定单元、异常数据库和报警执行单元,所述异常判定单元用于根据报警规则对单条监控数据进行分析后,得到异常信息,并将异常信息发送给异常数据库,所述报警执行单元用于获取异常数据库中的信息,执行报警。2.如权利要求1所述监控系统,其特征在于:所述异常判定单元的部署环境为集群化部署。3.如权利要求1所述监控系统,其特征在于:所述数据模块还包括数据归集单元,数据分发单元将接收到的采集数据分发给数据归集单元,数据归集单元用于将采集到的多维数据根据合并项目规则对数据进行归集处理,并将处理后的数据返回给数据分发单元。4.如权利要求1所述监控系统,其特征在于:所述报警模块还包括报警反馈单元,报警反馈单元用于判断是否误报警并反馈给异常数据库。5.如权利要求4所述监控系统,其特征在于:所述报警模块还包括深度学习分析单元,深度学习分析单元用于分析异...

【专利技术属性】
技术研发人员:吴斌斌苗辉
申请(专利权)人:贵州白山云科技有限公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1