一种基于机器学习的根因分析方法技术

技术编号:39593586 阅读:27 留言:0更新日期:2023-12-03 19:48
本发明专利技术公开了一种基于机器学习的根因分析方法

【技术实现步骤摘要】
一种基于机器学习的根因分析方法、介质和设备


[0001]本专利技术涉及流程挖掘根因分析的
,尤其是指一种基于机器学习的根因分析方法

介质和设备


技术介绍

[0002]近年来,随着流程挖掘领域中自动化因果推理技术的发展使得从流程日志中挖掘有症状案例的影响要素成为可能

流程日志是一系列事件

活动以及决策的集合,共同影响着结果

有些结果是正向的,而有些结果是反向的

显然,将流程的积极结果率最大化,或者相反将负面结果最小化,是有积极意义的

如果能够精准的发现负面结果的影响因素,那么就能够更快的定位问题所在,提高流程的效率以节约不必的时间

人力成本,从而提供更优质的服务

[0003]以往的根因分析分析方法侧重于分析观测数据与结果之间的相关性,而不是分析因果关系

与此同时,影响负面结果的因素可能来自很多方面,比如资源限制

不平衡的工作负载...

【技术保护点】

【技术特征摘要】
1.
一种基于机器学习的根因分析方法,其特征在于,包括以下步骤:
S1、
全量采集企业的历史流程日志,并对该历史流程日志进行排序;
S2、
对排序后的历史流程日志进行字段剔除的处理,并对每行日志数据的数值属性列做分区处理;
S3、
对步骤
S2
获得的数据做数值映射,并保存映射字典;
S4、
遍历步骤
S3
获得的数据,计算每个映射值出现的次数和支持度,设定最小支持度,并对其进行排序,删除小于最小支持度的映射值,将这些数据存入到项头表中;
S5、
根据项头表中的信息,对每行日志数据排序,并删除小于最小支持度的映射值;
S6、
遍历步骤
S5
的每行日志数据,建立
FP
树;
S7、
遍历步骤
S6

FP
树的项头表,从项头表的底部项依次向上找项头表项对应的条件模式基,从条件模式基中递归挖掘大于最小支持度的频繁项集;
S8、
根据步骤
S7
挖掘出的频繁项集生成关联规则,并计算对应关联规则的置信度以及提升度,删除小于最小置信度的规则,得到强关联规则;
S9、
将步骤
S8
中的被关联项不是0或1的强关联规则剔除,得到关联规则,并计算对应关联规则的得分;
S10、
将步骤
S9
中的关联规则通过步骤
S3
中的映射字典做还原操作,对于缺失的属性值,用该列属性出现最多次数的属性值填充,构建决策表;
S11、
将步骤
S10
得到的决策表输入到属性约简算法中,剔除冗余属性,计算有症状案例的根因属性
。2.
根据权利要求1所述的一种基于机器学习的根因分析方法,其特征在于,所述步骤
S1
包括以下步骤:全量采集企业的历史流程日志,设定为采集的历史流程日志,所述历史流程日志包括
Case ID、TimeStamp、Activity

RcaFlag
数据,其中设定为
Activity
的集合,为
TimeStamp
的集合,
RcaFlag
标记当前
Case ID
是否有症状,为其它属性列,
l
为每行日志数据,因此
l

(
α

τ

d1,
d2,


d
n
)

α
为的子集,
τ
为的子集,
d
i
为的子集,且
1≤i≤n。3.
根据权利要求1所述的一种基于机器学习的根因分析方法,其特征在于,所述步骤
S2
包括以下步骤:对步骤
S1
中采集的历史流程日志按照从小到大进行排序;将符合有症状条件案例的
RcaFlag
标记为1,其余无症状案例标记的
RcaFlag
标记为0;将历史流程日志的
Case ID
字段和
TimeStamp
字段剔除,将历史流程日志的每行数据
l
中数值属性列做分区处理,选取数值属性列的前
clusterNum
个点作为初始中心点,设定最小误差阈值为
0.01*clusterNum
,通过
KMeans
聚类算法迭代运算,计算出每个点所属的类簇,最终得到所有的分区区间,然后将属于对应分区区间的数值作区间替换
。4.
根据权利要求1所述的一种基于机器学习的根因分析方法,其特征在于,所述步骤
S4
包括以下步骤:
S4

01、
给定一个关联规则
X

Y
,其中项集
X
为关联规则的前件,项集
Y
为关联规则的后
件,且
S4

02、
计算关联规则
X

Y
的支持度
support(X

Y)
,其计算方式为:其中,
P(X∩Y)
为频繁项集中
{X

Y}
同时发生的次数,
N
为总项集的个数
。5.
根据权利要求1所述的一种基于机器学习的根因分析方法,其特征在于,所述步骤
S6
包括以下步骤:将排序后的日志数据插入
FP
树,插入时按照排序后的顺序插入到
FP
树中,排序靠前的节点是父节点,靠后的是子节点,若有共用的父节点,则对应的公用父节点计数加1;若有新节点出现,则项头表对应的节点会通过节点链表链接到新节点,直到所有的数据都插入到
FP
树后,
FP
树的建立完成
。6.
根据权利要求1所述的一种基于机器学习的根因分析方法,其特征在于,所述步骤
S8
包括以下步骤:
S8

01、
计算关联规则
X

Y
的置信度
Confidence(X

Y)
,其计算方式为:其中,
P(X∩Y)
为频繁项集中含
{X

Y}
同时发生的次数,
P(X)
为频繁项集中包含
{X}
发生的次数;
...

【专利技术属性】
技术研发人员:白杰陈志强梅珂胡兵
申请(专利权)人:北京杰成合力科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1