一种车联网系统智能运维系统及方法技术方案

技术编号:39512904 阅读:13 留言:0更新日期:2023-11-25 18:49
本发明专利技术涉及运维管理技术领域,且公开了一种车联网系统智能运维系统,包括:设施层,用于存储多类型数据;数据采集模块,用于采集所述设施层中的数据,并发送至数据治理模块;所述数据治理模块,对数据进行数据治理和数据清洗,并将规整后的数据保存至数据存储模块中;所述数据存储模块,用于对规整后的数据进行存储;功能表现层,通过

【技术实现步骤摘要】
一种车联网系统智能运维系统及方法


[0001]本专利技术涉及运维管理
,具体为一种车联网系统智能运维系统及方法


技术介绍

[0002]传统的车联网系统运维往往采用人力运维和可观测性设施相结合的方式,应用服务多数采用容器化部署或者在物理
/
虚拟机上进行裸机部属

[0003]车联网系统运维人员一般处理故障问题有以下步骤

[0004]运维人员收到告警通知,常用于邮件方式

[0005]运维人员查看可观测性设施,查看告警原因和近时间段趋势

[0006]运维人员登录对应问题资产或服务,定位问题原因,分析适用的解决方案

[0007]运维人员执行恢复方案

[0008]运维人员检查确认问题是否得到解决

[0009]团队进行问题复盘,添加保障措施

[0010]传统的车联网系统处理故障问题步骤较为复杂,依赖于人工处理的成分极多,因此会需要较长的时间去进行恢复纠错,给业务成本和服务可用性带来巨大的负面影响

[0011]此外,常用的容器化集群管理系统如
Kubernetes
也会存在一定的自动化故障探测和恢复功能,但使用场景窄,往往只能判断当前应用容器是否为可用状态然后对容器节点进行扩缩容或者替换重启的效果

[0012]因此,提供一种车联网系统智能运维系统及方法


技术实现思路

[0013]本专利技术的目的在于克服现有的缺陷而提供的一种车联网系统智能运维系统及方法,能够在车联网系统高并发量低时延场景需求下,主动及时地发现风险和故障问题,自动处理解决和提供后续保障方案

[0014]实现上述目的的技术方案是:
[0015]本专利技术之一的一种车联网系统智能运维系统,包括:
[0016]设施层,用于存储多类型数据;
[0017]数据采集模块,用于采集所述设施层中的数据,并发送至数据治理模块;
[0018]所述数据治理模块,对数据进行数据治理和数据清洗,并将规整后的数据保存至数据存储模块中;
[0019]所述数据存储模块,用于对规整后的数据进行存储;
[0020]功能表现层,通过
API
网关分发各类任务至任务调度模块;
[0021]所述任务调度模块,用于接受所述
API
网关请求,判断任务属性,将任务属性发送至策略服务模块,从所述数据存储模块获取对应任务属性的数据发送至
AI
训练模块,并将结果反馈至所述功能表现层;
[0022]所述
AI
训练模块,用于接收所述任务调度模块发送对应任务属性的数据,并对其
进行优化训练,获得
AI
模型;
[0023]所述策略服务模块,用于调用
AI
模型,根据任务属性,获取对应运维策略并输出给所述任务调度模块

[0024]优选的,数据类型包括:容器集群和物理
/
虚拟机资产信息

存储设备资产信息

数据库资产信息

运行资源占用情况指标

应用指标

系统日志指标

容量使用情况指标

系统配置指标

业务话单原始文件指标

业务数据指标

网络流量指标和链路时延指标

[0025]优选的,所述功能表现层包括:
[0026]数据查询模块,用于发布查询数据任务至所述任务调度模块,并对其反馈结果进行展示;
[0027]故障自动恢复模块,用于发布对数据扫描检查任务,对出现健康可用性问题或数据错误进行修复并向相应的责任人进行告警通知,由责任人签字确认修复完毕;
[0028]排障助手模块,用于发布对数据扫描检查任务,对扫描出现系统解决不了的健康可用性问题或数据错误向相应的责任人进行告警通知,并提供诊断信息和排障修复策略建议给到运维人员,由责任人签字确认修复完毕;
[0029]多维报表模块,用于发布统计报表任务至所述任务调度模块,并生成多维报表;
[0030]风险管理模块,用于发布对数据定时扫描检查任务,并在执行跑批任务前对数据发布预检查任务;
[0031]多渠道通知管理模块,用于根据不同的告警级别和规则通知不同的负责人或负责人组;
[0032]AI
训练平台,用于通过系统历史处理故障流程

方式和结果作为数据集进行模型优化训练

[0033]优选的,所述故障自动恢复模块恢复不了的健康可用性问题或数据错误,通过所述排障助手模块提供给运维人员进行修复

[0034]优选的,所述故障自动恢复模块和排障助手模块对处理完毕的故障问题进行根本原因分析,给出后续的保障优化建议记录归档生成知识图谱并存放到所述数据存储模块中

[0035]优选的,所述多维报表模块包括:
[0036]可靠性报表单元,用于统计系统故障间隔时间

系统恢复时间

系统失效前时间;
[0037]责任人处理时效报表单元,用于统计责任人响应时间

故障解决时间;
[0038]AI
处理报表单元,用于统计
AI
故障成功修复次数,
AI
故障成功修复率,
AI
故障处理时间

[0039]优选的,所述多渠道通知管理模块通知负责人或负责人组的方式包括电话

邮件
、webhook、
短信和
IM

UserId。
[0040]本专利技术之二的一种车联网系统智能运维方法,包括:
[0041]步骤
S1
,获取车联网系统的系统数据和业务数据;
[0042]步骤
S2
,对系统数据和业务数据进行多维度特征诊断分析;
[0043]步骤
S3
,判断系统风险是否存在及存在状态,提供风险策略建议,并预警负责人相关风险以及风险策略执行情况跟踪;
[0044]步骤
S4
,判断系统故障是否存在及存在状态,有故障执行自动修复策略,并预警负
责人相关故障以及修复情况;
[0045]步骤
S5
,分析系统风险及故障产生的原因并提供保障措施建议;
[0046]步骤
S6
,并将处理流程和结果记录归档供模型优化学习并生成知识图谱

[0047]优选的,所述步骤
S4
包括:
[0048]步骤
S41<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种车联网系统智能运维系统,其特征在于,包括:设施层,用于存储多类型数据;数据采集模块,用于采集所述设施层中的数据,并发送至数据治理模块;所述数据治理模块,对数据进行数据治理和数据清洗,并将规整后的数据保存至数据存储模块中;所述数据存储模块,用于对规整后的数据进行存储;功能表现层,通过
API
网关分发各类任务至任务调度模块;所述任务调度模块,用于接受所述
API
网关请求,判断任务属性,将任务属性发送至策略服务模块,从所述数据存储模块获取对应任务属性的数据发送至
AI
训练模块,并将结果反馈至所述功能表现层;所述
AI
训练模块,用于接收所述任务调度模块发送对应任务属性的数据,并对其进行优化训练,获得
AI
模型;所述策略服务模块,用于调用
AI
模型,根据任务属性,获取对应运维策略并输出给所述任务调度模块
。2.
根据权利要求1所述的一种车联网系统智能运维系统,其特征在于,数据类型包括:容器集群和物理
/
虚拟机资产信息

存储设备资产信息

数据库资产信息

运行资源占用情况指标

应用指标

系统日志指标

容量使用情况指标

系统配置指标

业务话单原始文件指标

业务数据指标

网络流量指标和链路时延指标
。3.
根据权利要求1所述的一种车联网系统智能运维系统,其特征在于,所述功能表现层包括:数据查询模块,用于发布查询数据任务至所述任务调度模块,并对其反馈结果进行展示;故障自动恢复模块,用于发布对数据扫描检查任务,对出现健康可用性问题或数据错误进行修复并向相应的责任人进行告警通知,由责任人签字确认修复完毕;排障助手模块,用于发布对数据扫描检查任务,对扫描出现系统解决不了的健康可用性问题或数据错误向相应的责任人进行告警通知,并提供诊断信息和排障修复策略建议给到运维人员,由责任人签字确认修复完毕;多维报表模块,用于发布统计报表任务至所述任务调度模块,并生成多维报表;风险管理模块,用于发布对数据定时扫描检查任务,并在执行跑批任务前对数据发布预检查任务;多渠道通知管理模块,用于根据不同的告警级别和规则通知不同的负责人或负责人组;
AI
训练平台,用于通过系统历史处理故障流程

方式和结果作为数据...

【专利技术属性】
技术研发人员:薛超孙智彬
申请(专利权)人:上海优咔网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1