【技术实现步骤摘要】
一种车联网系统智能运维系统及方法
[0001]本专利技术涉及运维管理
,具体为一种车联网系统智能运维系统及方法
。
技术介绍
[0002]传统的车联网系统运维往往采用人力运维和可观测性设施相结合的方式,应用服务多数采用容器化部署或者在物理
/
虚拟机上进行裸机部属
。
[0003]车联网系统运维人员一般处理故障问题有以下步骤
。
[0004]运维人员收到告警通知,常用于邮件方式
。
[0005]运维人员查看可观测性设施,查看告警原因和近时间段趋势
。
[0006]运维人员登录对应问题资产或服务,定位问题原因,分析适用的解决方案
。
[0007]运维人员执行恢复方案
。
[0008]运维人员检查确认问题是否得到解决
。
[0009]团队进行问题复盘,添加保障措施
。
[0010]传统的车联网系统处理故障问题步骤较为复杂,依赖于人工处理的成分极多,因此会需要较长的时间去进行恢复纠错,给业务成本和服务可用性带来巨大的负面影响
。
[0011]此外,常用的容器化集群管理系统如
Kubernetes
也会存在一定的自动化故障探测和恢复功能,但使用场景窄,往往只能判断当前应用容器是否为可用状态然后对容器节点进行扩缩容或者替换重启的效果
。
[0012]因此,提供一种车联网系统智能运维系统及方法
。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.
一种车联网系统智能运维系统,其特征在于,包括:设施层,用于存储多类型数据;数据采集模块,用于采集所述设施层中的数据,并发送至数据治理模块;所述数据治理模块,对数据进行数据治理和数据清洗,并将规整后的数据保存至数据存储模块中;所述数据存储模块,用于对规整后的数据进行存储;功能表现层,通过
API
网关分发各类任务至任务调度模块;所述任务调度模块,用于接受所述
API
网关请求,判断任务属性,将任务属性发送至策略服务模块,从所述数据存储模块获取对应任务属性的数据发送至
AI
训练模块,并将结果反馈至所述功能表现层;所述
AI
训练模块,用于接收所述任务调度模块发送对应任务属性的数据,并对其进行优化训练,获得
AI
模型;所述策略服务模块,用于调用
AI
模型,根据任务属性,获取对应运维策略并输出给所述任务调度模块
。2.
根据权利要求1所述的一种车联网系统智能运维系统,其特征在于,数据类型包括:容器集群和物理
/
虚拟机资产信息
、
存储设备资产信息
、
数据库资产信息
、
运行资源占用情况指标
、
应用指标
、
系统日志指标
、
容量使用情况指标
、
系统配置指标
、
业务话单原始文件指标
、
业务数据指标
、
网络流量指标和链路时延指标
。3.
根据权利要求1所述的一种车联网系统智能运维系统,其特征在于,所述功能表现层包括:数据查询模块,用于发布查询数据任务至所述任务调度模块,并对其反馈结果进行展示;故障自动恢复模块,用于发布对数据扫描检查任务,对出现健康可用性问题或数据错误进行修复并向相应的责任人进行告警通知,由责任人签字确认修复完毕;排障助手模块,用于发布对数据扫描检查任务,对扫描出现系统解决不了的健康可用性问题或数据错误向相应的责任人进行告警通知,并提供诊断信息和排障修复策略建议给到运维人员,由责任人签字确认修复完毕;多维报表模块,用于发布统计报表任务至所述任务调度模块,并生成多维报表;风险管理模块,用于发布对数据定时扫描检查任务,并在执行跑批任务前对数据发布预检查任务;多渠道通知管理模块,用于根据不同的告警级别和规则通知不同的负责人或负责人组;
AI
训练平台,用于通过系统历史处理故障流程
、
方式和结果作为数据...
【专利技术属性】
技术研发人员:薛超,孙智彬,
申请(专利权)人:上海优咔网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。