【技术实现步骤摘要】
一种基于马尔可夫模型的数据中台运行故障预测方法
[0001]本专利技术属于数据分析领域,涉及数据中台运行故障预测技术,尤其是一种基于马尔可夫模型的数据中台运行故障预测方法。
技术介绍
[0002]数据中台是一种战略选择和组织形式,依据企业特有的业务模式和组织架构,将有形的产品和实施方法作为支撑,进而构建一套不断把数据变成资产并服务于业务的机制。数据中台一般具备数据采集整合、数据提纯加工、数据服务可视化和数据价值变现四个能力。
[0003]当前数据中台运维工作存在一系列困难。主要体现在:
⑴
系统架构复杂导致日常的巡检繁琐,同时工作量大并且系统风险具有隐蔽性,不易被发现;
⑵
与传统成熟的软件服务相比,数据中台故障诊断困难,对运维人员的经验依赖严重。
[0004]由于数据中台无论在系统架构还是物理部署上均和传统的B/S架构信息系统有较大区别,这就要求运维人员不仅需要对数据中台主机层面、中间件和应用系统等传统运维体系内容熟悉,还需要学习和了解数据中台各类新型组件的巡检和使用,同时,由于对数据中台的运维经验储备尚不充足,对于数据中台各类故障的处理效率较低。当前在数据中台运行故障提升方面的工作主要还是依赖具有一定经验的运维人员,缺少行之有效的自动化方法。
[0005]针对上述数据中台运维的痛点问题,本专利技术提出了一种基于马尔可夫模型的数据中台运行故障预测方法。马尔可夫模型是一个双重随机过程,该过程分为马尔可夫链和观测过程,在第一个随机过程中,马尔可夫链用于描述不同状态 ...
【技术保护点】
【技术特征摘要】
1.一种基于马尔可夫模型的数据中台运行故障预测方法,其特征在于:包括如下方法步骤:步骤A:量化运行状态结合电网营销、设备、人资和运检相关业务需求和数据中台应用组件架构体系两方面,完成数据中台各类故障、组件状态和故障影响范围的梳理和基础数据采集,利用数学模型完成数据分层、分类和关系梳理,构建数据中台运行的量化评价体系,利用量化数据客观地对系统潜在风险进行提示,衡量数据中台健康状态,所述的数据中台运行的量化评价体系包括“业务故障现象”、“组件故障现象”、“关键运行指标”、“关键运行状态”、“运维对象”和“影响范围”六层数据中台运行状态量化评价体系;步骤B:故障诊断模型制定为快速定位数据中台各类故障,利用评价体系数据和组件关联关系,构建故障诊断概率数学模型,并基于马尔可夫链进行概率验证和优化,提升故障诊断准确度,在数据中台发生故障后,输入故障数据可快速筛查排查组件顺序,为恢复数据服务提升效率,根据六层状态评价体系模型中的关联关系,以及电力数据中台运维积累数据,定义各层关联间的概率,由此,在发生了第一层业务故障后,可以根据各层关联走向和概率分布,快速筛查第五层运维对象引发故障的排查顺序,同时可以同步预警第六层对应影响范围,模型算法如下:式中,代表运维对象y
j
发生运行问题导致业务故障x
i
发生的概率;代表组件故障c
n
发生导致业务故障xi发生的概率;代表指标t
k
异常导致组件故障c
n
发生的概率;代表状态S
m
异常导致指标t
k
异常的概率;代表运维对象y
j
发生运行问题导致状态S
m
发生异常的概率,X为业务故障,C为组件故障Component Fault,T为指标Target,S为状态Status,Y为运维对象,业务故障、组件故障、关键运行指标、关键运行状态和运维对象的个数分别为m、n、k、l、r,i=1
…
m,N=1
…
n,K=1
…
k,L=1
…
l,j=1
…
r,模型中,各节点的关联关系概率均为运维数据积累,为提升模型准确度,引入马尔可夫模型对随机状态转化概率进行优化;步骤C:预警模式优化基于数据中台评价体系和故障诊断模型,摒弃单一阈值预警运维模式,通过算法动态判断系统异常状态,采用关联动态阈值替代简单阈值设定报警门限,降低数据中台运行风险,基于隐马尔可夫的数据中台故障诊断模型,提出了数据中台主动运维模式,分别从主动预警、主动学习和主动反馈三方面构建。2.根据权利要求1所述的一种基于马尔可夫模型的数据中台运行故障预测方法,其特征在于:所述的第一层业务故障现象,定义电网各类业务需求和各类业务事故,本层状态为数据中台用...
【专利技术属性】
技术研发人员:张倩宜,包永迪,郝美薇,江黛茹,张旭,颜阳,杨丹丹,付嘉鑫,胡博,张驰,申琳琳,
申请(专利权)人:国家电网有限公司国网天津市电力公司信息通信公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。